Test: Audionamix XTRAX STEMS DJ-/Studio-Software

2. Juli 2020

Teile und hersche! Automatische Spuren-Extraktion mit Audionamix XTRAX STEMS

Audionamix Xtrax Stems

Audionamix Xtrax Stems

Audionamix XTRAX STEMS ist eine Software bzw. ein Dienst von Audionamix, der sich auf die Fahnen schreibt, jeden Track automatisch in die Bestandteile Drums, Bass, Vocal und den Rest zu separieren.
Das klingt absolut unglaublich, denn wenn das wirklich funktionieren sollte, hätte XTRAX STEMS das Zeug, Musikproduktion und DJing gehörig auf den Kopf zu stellen.
Ob XTRAX STEMS funktioniert und wie es sich als Tool für DJs schlägt, soll unser Test zeigen.

Vorweg: Das Thema Track-Separierung in Einzelspuren ist gerade ein super heißes Thema. Zum einen verfügt Algoriddim mit der djay Pro AI DJ-Software bzw. dem Update von der djay Pro über eine Software für iOS Geräte mit Echtzeit-Separierung von Tracks in drei Spuren, Vocals, Melodie und Drums. Das allerdings nur für einige Apple-Geräte mit einem bestimmten Chip. Am selben Tag kündigte auch Virtual DJ eine Neuheit an und ermöglicht mit der Virtual DJ 2021 DJ-Software jetzt bereits einige Möglichkeiten, Audio-Spuren aufzutrennen und damit zu arbeiten, zum Beispiel mit drei separierten Spuren (Vocals, Beat, Instruments) statt einem EQ oder mit extra separierten STEM-Files mit bis zu fünf Spuren. Also ja, das Thema ist heiß. Richtig heiß!

Dies ist nicht der erste Test der Spuren-Extraktionssoftware von Audionamix. Unseren Text zur ersten Version findet ihr hier. 
Was hat sich seitdem geändert? Es werden nicht mehr nur drei Spuren, sondern 4 extrahiert: Drums, Vocal, Bass und der Rest. 
Außerdem wurde der Dienst auf ein Abomodell umgestellt, das entweder mit 40 $ für sechs Monate oder 60 $ pro Jahr zu Buche schlägt.

Eine Möglichkeit, pro bearbeitetem Track zu bezahlen, gibt es nicht, aber eine zweitägige kostenlose Trialphase ermöglicht es, den Dienst auszuprobieren. Da die Analyse und Separierung der einzelnen Spuren nicht in der Software selbst, sondern auf den Servern von Audionamix geschieht, wirkt es durchaus verständlich auf mich, den Dienst per Subscription umzusetzen.
 Das bedeutet aber auch, dass sich ein Abo nur lohnt, wenn man den Dienst auch wirklich regelmäßig (und oft) nutzt.
Ebenfalls nicht mehr mit an Bord, die Möglichkeit, verschiedene Modi auszuwählen, um den optimalen Kompromiss zwischen besserer Separierung der Einzelspuren und dem Übersprechen der anderen Instrumente in die ausgewählte Spur zu wählen. Stattdessen gibt es auf jeder Spur einen sogenannten „De-Bleeding“-Regler, mit dem man den Grad des Übersprechens einstellen kann.

Audionamix XTRAX STEMS Workflow

Sobald man einen Track in die Software lädt und eine der fünf möglichen Extraktionsarten gewählt hat (einzelne Spur oder alle vier), benötigt Audionamix bei meiner Internetverbindung im Durchschnitt ca. zwei Minuten, um das File hochzuladen, die Spuren zu separieren und die fünf resultierenden Files wieder herunterzuladen.
 Also schnell genug, um wirklich praxistauglich zu sein, aber nicht schnell genug, um als Echtzeit durchzugehen.

Im nächsten Schritt kann man die extrahierten Spuren mit dem Original vergleichen, die Lautstärkeverhältnisse anpassen und bei jeder Spur über einen sogenannten „De-Bleeding“-Regler, die Stärke der Separierung anpassen.
 Um sich leichter einen Überblick zu verschaffen, stehen Solo und Mute für jeden Kanal zur Verfügung. In die gleiche Kerbe schlägt die Möglichkeit, einen beliebigen Teil des bearbeiteten Tracks zu loopen.

Im nächsten Schritt kann man das Ergebnis der Extraktion exportieren. Hierfür stehen mehrere Optionen zur Verfügung. WAV und AIFF in alle gängigen und weniger gängigen Sampleraten bis hoch zu 192 kHz und Bitraten von 8 bis 32 Bit, sowie MP3 und sogar Ogg und Flac.

Audionamix XTRAX STEMS

Die durchaus beeindruckende Liste der exportierbaren File-Formate

Als DJ und großer Fan des Potentials des STEMS-Formats von Native Instruments sehe ich in der Möglichkeit, ebenjene Files zu erzeugen, das größte Potential der Software. 
Und tatsächlich, XTRAX STEMS ist in der Lage, einen STEMS-kompatiblen MP4-Container auszuspucken, der in Traktor geladen werden kann. Ganz klar, ich bin angefixt. Schließlich haben NIs STEMS seit Erscheinen zwar viel Faszination und Rauschen in der Presse erzeugt, konnten sich aber nicht wirklich durchsetzen und nach einer anfänglichen Euphoriephase kommen auch kaum noch neue Veröffentlichungen hinzu. 
So bleibt neben selbstproduziertem Material und gelegentlichen Remix-Wettbewerben kaum eine Möglichkeit, an Einzelspuren heranzukommen, die man zur Produktion von STEMS nutzen könnte.
Die Möglichkeit, in einem Schritt direkt einen NI STEM-Container zu erstellen, hat natürlich enorm Charme und könnte den Workflow, eigene NI STEMs zu erstellen, ein gutes Stück beschleunigen,
wenn es da nicht einen Haken gäbe: Ein mit Native Instruments hauseigenem STEM CREATOR erstellter Container enthält nicht nur die Files, sondern übergibt auch Kompressoreinstellungen seines Master-Kompressors, die die 4 Stems in Traktor mehr aus einem Guss klingen lassen können. Der geniale Trick hierbei ist, dass man im STEM-CREATOR den Kompressor einstellen kann, dieser aber nur seine Einstellungen in das NI STEM-File schreibt, die dann erst vom STEM-Kompressor in Traktor angewendet werden. Auf diese Art möchte NI sicherstellen, dass auch STEMS so schön rund klingen können, wie ein Track, über den ein Master-Kompressor gelaufen ist.

Da die Exportfunktion von XTRAX STEMS nicht über einen solchen Kompressor verfügt, empfehle ich nach wie vor den Umweg über das Tool von NI, auch wenn es ein bisschen mehr Arbeit macht. Und da NIs Software die Möglichkeit beinhaltet, gleich ein Cover-Bild einzubetten, bleibt die Anzahl an Schritten eher gleich, bis das STEM-File in der DJ-Library angekommen ist.

Native Instruments‘ STEM CREATOR mit seinem Masterkompressor

Wie klingt das Ergebnis?

Kommen wir zum Wichtigsten: Wie klingt das Ganze nun? Taugen die separierten Spuren zur Weiternutzung? Wenn ja, zu welcher Art der Nutzung?

 Vorweg: Ich bin wirklich und ernsthaft tief beeindruckt, dass es diesen Dienst überhaupt gibt. Ich mag mir gar nicht vorstellen, wie viel Arbeit und Know-how in den Algorithmen steckt, die verschiedenste Frequenzbereiche und Transienten analysieren und den verschiedenen Instrumentengruppen zuordnen kann. Mein innerer Nerd jubiliert ob der schieren Zaubereihaftigkeit dieser Technologie. Das ist in letzter Konsequenz mehr Zukunft als Autotune oder Abletons Audio-to-MIDI-Converter.
 Aber so leid es mir tut, das Ergebnis ist (noch!) nicht soweit, dass ich mir vorstellen könnte, es in irgendeiner Art von Musikproduktion oder fürs Deejaying einzusetzen.
Die Trennung der Spuren ist nicht gut genug bzw. die Artefakte sind einfach zu störend. Die einzelnen Spuren klingen abgehackt, schwanken in der Lautstärke und klingen wie ein schlechtes MP3. Mit dem Bleeding-Regler lassen sich die Artefakte vermindern, was aber zu Lasten der Kanaltrennung geht. Da das alles sehr schwer in Worte zu fassen ist, habe ich mal ein Video gemacht, das hoffentlich etwas Klarheit bringt.
 Man hört da recht deutlich, dass die Summe der separierten Einzelspuren sehr nah am Original ist, die Artefakte aber mit jeder Spur, die man stummschaltet, immer mehr zunehmen.

Ob das zur Produktion von Remixen oder Edits ausreicht, muss jeder selbst entscheiden. Mir ist es lieber, dem Originalfile mit den handelsüblichen Methoden wie EQs und Filter mit und ohne Sidechaining zu Leibe zu rücken am Ende lieber.

Audionamix XTRAX STEMS im DJ-Einsatz

OK, was ist dann mit dem Einsatz fürs Deejaying? Da sollten doch ein paar Artefakte weniger stören und in der Hitze der Nacht nicht so auffallen. Oder doch?
 Um das zu testen, habe ich noch ein Video erstellt, in dem ich eine typische DJ-Situation nachstelle. Es läuft ein Track und ein zweiter wird darübergemixt. Auf dem linken Deck benutze ich die Lautstärkeregler der einzelnen Spuren meines mit Hilfe von XTRAX STEMS erstellten NI STEM-Files, um Drums und Bass leisezudrehen, auf dem rechten Deck läuft dasselbe File, aber hier nutze ich das Filter und den Höhenregler, um ganz klassisch Bass und Kick sowie die HiHats des Tracks aus dem Weg zu bekommen. Die klassische Variante auf dem rechten Deck mit EQs und Filtern klingt besser, sauberer, natürlicher. Damit entfällt der Sinn der aufwendigen Erstellung eines STEM-Files mit XTRAX STEMS komplett. Auf jeden Fall rechtfertigt das Ergebnis in meinen Augen nicht den Aufwand. Aber hört selbst:

Fazit

Audionamix XTRAX STEMS ist ein höchst faszinierender Dienst zur Separierung eines Stereotracks in vier STEMS, der das Potential hat, DJing und Remixing zu revolutionieren. Im Moment ist die Technik allerdings noch nicht reif für die Bühne oder das Studio. Die Artefakte sind zu dominant, die Transienten nicht sauber genug, selbst bei Nutzung für einen DJ-Mix. 
Für Musiker, die zum Beispiel ein Instrument aus einer Aufnahme entfernen wollen, um es zu Übungszwecken selbst wieder dazuzuspielen oder für Karaokezwecke, kann ich mir die Software allerdings sehr gut vorstellen. 
Dank der zweitägigen kostenlosen Trial-Phase kann jeder sich selbst ein Bild machen. Der Abopreis von 40 $ für 6 Monate oder 60 $ für ein Jahr erscheint mir ein wenig hoch.
Die Vorstellung, dass diese Software irgendwann soweit sein könnte, in einer DJ-Software integriert zu sein und in Echtzeit STEMS aus Stereotracks zu extrahieren, kann allerdings nur als feuchter Traum beschrieben werden. Und wie schon erwähnt, gibt es genau dafür ja die ersten beiden Software-Lösungen dank Virtual DJ und Algoriddim.

Plus

  • Ausgabe in vielen gängigen Formaten
  • direkte Ausgabe als NI STEM
  • zweitägige kostenlose Testphase

Minus

  • hoher monatliche Kosten durch das Abomodell
  • nicht artefaktfrei
  • nicht bühnen- oder studioreif
  • Berechnung erfolgt online anstatt lokal

Preis

  • 40,- $ für sechs Monate oder
  • 60,- $ für ein Jahr
Forum
  1. Profilbild
    Armin Bauer  RED 111

    Hallo Walter,

    das scheint ein ganz ähnlicher Ansatz zu sein, den iZotope mit dem Music Rebalance PlugIn in RX 7 bietet. Natürlich etwas ausgefeilter und spezialisierter (STEM Ausgabe).
    Ich konnte in meinem Test aber mit Music Rebalance recht gute Ergebnisse erzielen. Das ist übrigens schon in RX 7 Standard enthalten, die im Moment für unter 300,- Euro verkauft wird.
    Vielleicht kannst du dir ja mal die Trial runter laden und vergleichen?

    Grüße Armin

    • Profilbild
      Larifari  AHU

      Dann aber bitte auch mit den anderen Konkurrenten. Grade in dem Bereich gab es im letzten Jahr eine Flut an Software.

  2. Profilbild
    Morphoder  

    Die machine learning algorithmen dafür sind frei erhältlich. Sie basieren meist auf den sog. Spleeter algo. Mit ein etwas Kenntniss in Python kann man das ohne subscription auf dem heimischen (Win) Rechner machen. Mit sehr guten Ergebnissen. Da der sourcecode auf Github verfügbar ist springen jetzt sehr viele Firmen auf diesen Zug auf um ein Stück vom Kuchen abzubekommen.
    Diese Artikel dazu:
    (von der Red gelöscht. Bitte bei langen Links Link-Shortener verwenden)

  3. Profilbild
    Marcel Halbeisen  

    Mal ne ganz andere Frage: Wie sieht das rechtlich aus? Wenn ich jetzt ein Musikstück einer Band berechnen lassen will, wird das zu diesem Softwarehersteller hochgeladen. Aber genau das ist ja eigentlich nicht erlaubt. Grauzone? (ich meine damit nicht die ehemalige Band aus der Schweiz)

    • Profilbild
      Larifari  AHU

      Interessante Frage..streng genommen ist es ja dann ein Filehost…allerdings nicht öffentlich. Also gehts wahrscheinlich eher in die rechtliche Richtung Dropbox als in die Richtung YouTube/ SoundCloud.

  4. Profilbild
    DJ Ronny  

    Hi, erst mal danke für den Test. Genau wie du selbst geschrieben hast, klingt das nicht besonders gut. Ich dachte mir vielleicht liegt es am Titel. Also habe ich es genau mit diesen mit einer Flac Datei mit Virtual DJ probiert.
    Regle ich das ganze über die Pad’s klingt es genau so schlimm. Verwende ich aber die 3 oder besser 5 EQ Regler, ist das Ergebnis um Welten besser.
    ? 5 EQ Regler am DJ Mixer? Dazu verwendet VDJ den Gain und Filter mit. Genial!
    Kann ich dann noch ohne Störungen im laufenden Titel umstellen.
    Man kann für jeden Titel dauerhaft Stems erstellen. Geht wenn ich will automatisch. Brauch ich aber nicht. Vorausgesetzt ein leistungsfähiger Rechner ist vorhanden, erstellt die Software die Stems auch temporär, beim laden des Titels. Dauert bei 5 Minuten Song keine 10 Sekunden.

  5. Profilbild
    Michael Krusch  RED

    Interessante Entwicklung und über die Jahre wird die Qualität bestimmt steigen, bis es ein Standard wird.
    Audio-Warping von Ableton live war am Anfang auch nicht so pralle.

  6. Profilbild
    Ted Raven  AHU

    Software, die Tracks eines kompletten Songs voneinander trennt, gab es ja schon in den frühen Neunzigern. Damals lag der Fokus darauf, Gesang vom Rest zu trennen. Kurz danach kamen die ersten Programme, die alle Instrumente voneinander trennen sollten. Alle Versuche verliefen mehr schlecht als recht. Seit ein paar Jahren gibt es ein wirklich schlechtes Smartphone-Programm, das angeblich aus jedem Track sauber die Bassspur extrahiert (der Entwickler ist wegen Schleichwerbung aus verschiedenen Foren geflogen). Das ist also alles nichts Neues.

    Mich erstaunt jedoch sehr, dass die diesbezügliche Entwicklung in den letzten mehr als fünfundzwanzig Jahren offensichtlich vollkommen auf der Stelle tritt. Ich habe nie erwartet, dass es eine hundertprozentige Lösung geben wird, das ist auch gar nicht möglich. Eine Verbesserung, die zumindest hin und wieder ein brauchbares Ergebnis liefert, wäre doch zu erwarten gewesen.

Kommentar erstellen

Die AMAZONA.de-Kommentarfunktion ist Ihr Forum um sich persönlich zu den Inhalten der Artikel auszutauschen. Sich daraus ergebende Diskussionen sollten höflich und sachlich geführt werden. Haben Sie eigene Erfahrungen mit einem Produkt gemacht, stellen Sie diese bitte über die Funktion Leser-Story erstellen ein. Für persönliche Nachrichten verwenden Sie bitte die Nachrichtenfunktion im Profil.