Generell kann man Folgendes feststellen
In den einzelnen Spuren ist oftmals Übersprechen zu hören. Teile von Melodien, Synthies oder Flächen, wenn im tieferen Frequenzbereich, sind in der Drum-Spur zu hören und fallen dort dem Algorithmus zum Opfer, der Drums relativ straight beendet, ebenso finden sich Melodie-Parts in der Vocal-Spur, wenn diese im höheren Frequenzbereich liegen. Auch finden sich hier zum Beispiel Becken wieder, die im Bereich 5 bis 10 kHz liegen.
Die Mitten sind in der Regel gut herausgearbeitet. Teilweise sind noch Transienten von Snare oder Hats hörbar in der Music-Spur. Ebenso tiefere Frequenzanteile von Vocals, Addlips oder Background-Vocals. Hier arbeitet einfach der Algorithmus und verpackt das Ganze in die Spur, die nicht das Vocal ist. So wie man es im Mix auch machen würde – Background-Vocals eher eingebettet im Hintergrund.
Die Vocal-Spur ist je nach Track-Gestaltung sehr sauber, Vocals gut getrennt. In dem oberen Frequenzbereich können noch Reste von Becken oder Melo-Teile zu finden sein, die der Algorithmus einfach aufgrund der Frequenz eher in den Bereich Vocal verordnet, statt zum Beispiel in Drums.
Audinamix XTRAX STEMS leistet eine sehr gute Vorarbeit. Einfach in der Handhabung und schnell im Vergleich zur mühseligen Handarbeit. Zudem glaube ich kaum, dass ansatzweise hinsichtlich der Zeit vergleichbar ein solches Ergebnis entstehen könnte. Wer ein wenig probiert, wird selbst herausfinden, welcher der vier Modi am besten geeignet ist für die Tracks der Wahl, natürlich kann man auch Drum-Spuren mit dem einen und Vocals mit dem anderen Modus extrahieren.
Wer das Ergebnis noch verbessern möchte, der sollte noch einmal zu Filter und EQ greifen und das Ergebnis nach eigenen Wünschen verbessern. So kann man sicherlich in der Vocal-Spur aktiv werden und mit einem High-Cut ein wenig den Becken entgegenwirken, deren Ausklang zischelnd über dem Vocal liegen kann.
Auf der Vocal-Spur kann auch ein Low-Cut mittlere Gürte bei circa 400 Hz viel bewirken, damit die Artefakte des Synthies ein wenig verschwinden. Natürlich wird damit aber auch das Vocal dünner, raubt man der Stimme ja unweigerlich Grundtöne.
Diese Feinheiten kann der Algorithmus natürlich nicht abwägen und so sollte man hier noch einmal tätig werden. So ist auf jeden Fall noch mehr rauszuholen und mit unter 15 Minuten Aufwand pro Track gewinnt man drei Spuren, getrennt, bearbeitet und wenn man möchte, auch schon zu Samples geschnitten. Zumindest, sofern der Track nicht über 5 oder 6 Minuten lang ist, denn dann dauert der gesamte Prozess der Extraktion mehr bereits mehr als 10 Minuten.
Für einen Track von rund 3 Minuten Länge braucht die Software rund 4 Minuten und 30 Sekunden, Automatic HQ bei 44 Mbps Down- und 8,55 Mbps Upload.
Ein Track, 6 Minuten 15 Sekunden, benötigt im gesamten Prozess (Upload, Extraktion, Download und „Processiong Results“, also die Verarbeitung in der Software) bei Wahl von Generic HQ 15 Minuten und 29 Sekunden.
Deutlich schneller geht es bei Wahl der reinen Generic Modes, dann kostet der ganze Prozess nur rund 8 Minuten.
Man kann also schätzen, dass die Dauer des Prozesses etwas mehr als die doppelte Länge des Materials ist.
Eine kleine Information am Rande: Natürlich klingen die drei extrahierten STEMS gleichzeitig abgespielt nicht exakt wie der Track, aus dem sie heraus gearbeitet worden sind. Aber fast.
Hi, danke für den Test. Interessante Sache, nicht nur für Stems . Nr. 14 ist aber nicht das Orginal. Hast du auch Rockmusik probiert und wie waren die Ergebnisse. Ich habe da ein paar LieblingsTitel, die es leider nur in Mono gibt. Die ließen sich damit bestimmt aufpolieren.