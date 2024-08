Ist das Musik - oder kann das weg?

In unserem Vergleichstest vergleichen wir MIDI-Generatoren, die mit künstlicher Intelligenz MIDI-Spuren bzw. Songs erzeugen können. Im Gegensatz zum letzen Vergleichstest, bei denen die KI-Musik-Services SUNO und UDIO im Fokus standen, handelt es sich hier um die reine Erzeugung von MIDI-Daten. Es können zwar auch komplette Songs erstellt werden, jedoch ohne Vocals und immer basierend auf MIDI-Daten, nicht auf Audiodaten. Dieser WOW-Effekt bleibt also aus und KI MIDI-Generatoren sind schon eher ein Angebot, das sich an Musiker wendet.

Verschaffen wir uns einen Überblick, was die KI-MIDI-Generatoren können und wie sich der Arbeitsfluss mit den einzelnen Werkzeugen darstellt. Zum Schluss müssen wir uns dann noch ein paar Ergebnisse anhören, um die Qualität beurteilen zu können. Alle drei Tools sind dabei etwas anders aufgestellt. Allen gemeinsam ist aber, dass sie wie eine DAW im Browser funktionieren. Nur für AIVA gibt es auch eine Standalone-Version. Ich möchte mich zudem auf die KI-Funktionen beschränken und nicht den kompletten Umfang der KI-MIDI-Generatoren darstellen, die teilweise komplette DAWS mit Effekten und Instrumenten darstellen. Alle KI-MIDI-Generatoren können übrigens über Web-MIDI über den Browser mit eurer Hardware kommunizieren.

KI MIDI-Generatoren – Preise

Ohne ein Abonnement ist aber keines der Programme nutzbar, ob nun im Browser oder nicht. Die Preise bewegen sich dabei bis 20,- $ pro Monat, je nachdem welche Version abonniert wird.

Nur in der höchsten Preiskategorie beim jeweiligen Bewerber in unserem KI-MIDI-Generatoren Vergleich sind auch alle Funktionen freigeschaltet. Jeder Kandidat besitzt zudem eine freie „Schnupper-Variante“, mit dem das Angebot ausgetestet werden kann, wobei sich Staccato hier unvorteilhaft anstellt. Die 10 freien Credits gehen für jeden noch so kleinen Schritt weg und eine Beurteilung des Services ist so kaum möglich.

Vergleichstest: MIDI-Generatoren mit KI – AIVA

Beginnen wir bei unseren KI-MIDI-Generatoren mit dem dienstältesten Service AIVA. Es verwendet in erster Linie die Deep Neural Network (DNN)-Technologie, wodurch es in die Lage versetzt wird, Originalkompositionen zu generieren, die die Stile verschiedener Musikgenres und Komponisten nachahmen. Der Prozess beginnt normalerweise mit der Auswahl des Musikstils oderdes Genres, das ihr erstellen möchtet, z. B. Klassik, Pop, Jazz oder EDM. Nutzer können verschiedene Parameter wie die Länge der Komposition, das Tempo, die Tonart und die Instrumentierung festlegen. Sobald diese festgelegt sind, generiert AIVA auf Basis dieser Eingabekriterien ein Musikstück.

Derzeit unterstützt AIVA keine direkten Textaufforderungen zum Erstellen von Musikideen. Damit unterscheidet es sich von den beiden anderen Services in unserem KI-MIDI-Generatoren Vergleich – diese haben beide die Möglichkeit, aus Text-Prompts (in englischer Sprache) Spuren, Noten und Instrumentation zu erzeugen.

Stattdessen ist die Interaktion bei AIVA strukturierter, da Nutzer entsprechende Optionen und Einstellungen aus Menüs auswählen kann. Derzeit können die Richtung und das Gefühl der Kompositionen (dargestellt durch Emojis) über die verfügbaren Einstellungen und Anpassungstools beeinflusst werden.

Die Gesamtheit dieser Einstellungen nennt AIVA Stile und diese werden auch zur späteren Nutzung gespeichert. Jede Anwendung eines Stils bringt schließlich eine oder mehrere Variationen hervor, die dann in der Track-Übersicht landen. Von hier aus können die Tracks und ihre Spuren sowie die Instrumentation in einer DAW-Ansicht editiert werden.

Sehr praktisch ist hier die Unterteilung des Tracks in gegliederte Abschnitte. Diese können verschoben, gelöscht oder neu eingefügt werden und können auf bereits bestehenden Abschnitten beruhen und somit Variationen darstellen oder komplett neu generiert werden.

In dieser DAW-Ansicht finde ich auch die größte Einschränkung des Services – ein erstellter Song wird immer komplett vorgegeben und so ist es nicht möglich, einzelne Spuren stummzuschalten oder deren MIDI-Daten zu ändern, ohne den kompletten Track neu rendern zu müssen. Die erwähnte Standalone-App kann das zwar – die Browser-Version aber nicht. Diese Einschränkung gilt übrigens für alle Browser.

Die Ergebnisse sind nicht überwältigend, aber mit etwas Editierung der Stile und der erzeugten MIDI-Spuren können zumindest kohärente Ergebnisse erzeugt werden. Die Ergebnisse können als MP3-, WAV- (in verschiedenen Auflösungen) und als MIDI-File heruntergeladen werden. Nur beim Herunterladen wird dann auch eine Nutzung „berechnet“ – das heißt, es kann solange am Song gefeilt werden, bis es passt.

Was ich zudem positiv erwähnen möchte, ist die Funktion der „Influences“. Hier können MIDI- oder Audio-Daten hochgeladen werden, nach deren Analyse AIVA dann Variationen erstellen kann. Das MIDI-File muss dabei bestimmten Ansprüchen gerecht werden, wie z. B. mehrere Spuren enthalten und quantisiert sein, Audio-Dateien haben diese Einschränkungen nicht.

Auf diese Weise kam ich zu Ergebnissen, die tatsächlich recht interessant klangen, selbst wenn die Eingabe eine eher wilde Improvisation war – unbedingt mal antesten.

Vergleichstest: MIDI-Generatoren mit KI – WAVtool

Sven Rosswog behandelte ja bereits den Service WAVtool und so erhält er auch nur einen kleinen Abschnitt in unserem KI-MIDI-Generatoren Vergleich. WAVtool ist dabei eine echte DAW im Browser mit eigenen virtuellen Instrumenten (auch VSTs auf dem Rechner können über die WavTool Bridge genutzt werden), externen MIDI-Geräten und Audiospuren.

Mit dem Pro-Plan von WAVtool steht einem ein Chat-Assistent zur Verfügung, dem ganz einfach Anweisungen gegeben werden können. Am besten funktionieren Schritt-für-Schritt Anweisungen, die Erzeugung kompletter Track-Gerüste damit gelingen jedoch selten bis gar nicht.

Mein Versuch, über den „Conductor Chat“ einen Drum-and-Bass-Track zu erzeugen, gelang nicht mal im Ansatz. In unserem KI-MIDI-Generatoren ist dieser Service wohl ein DnB-Agnostiker. Auch nach mehreren Prompts, bei denen auch gern mal zwischendurch die angegebene BPM-Zahl auf Halftime landete, erzeugte WAVtools KI-Assistent nichts, was auch nur im Ansatz mit DnB zu tun hätte.

Alles in allem scheint die Anbindung des Conductor Chat und die Ausgabe von MIDI-Clips noch nicht sehr fortgeschritten zu sein. Außer sehr rudimentären Ergebnissen konnte kaum etwas produziert werden, was nicht 100-mal schneller manuell hätte erzeugt werden können.

Auf der Plus-Seite haben wir mit WAVtool eine vollständige DAW im Browser, die auch Stem-Separierung beherrscht – hier kann der Service glänzen. Ob nun eine DAW im Browser wirklich notwendig ist, steht auf einem anderen Blatt. Ich persönlich könnte mir keinen Anwendunngsfall vorstellen, bei dem ich nicht lieber auf meine installierte DAW zurückreifen würde. Nicht alles, was technisch möglich ist, ist auch notwendig sinnvoll.

Vergleichstest: MIDI-Generatoren mit KI – Staccato

Ganz neu auf dem Markt ist Staccato und es präsentierte sich in unserem KI-MIDI-Generatoren Vergleich sowohl als Helfer zum Erzeugen von MIDI-Daten als auch von Song Lyrics – eine Erzeugung von KI-Stimmen gibt es allerdings nicht. Im Pro Plan kann auf beide Generatoren zugegriffen werden und auch Staccato ermöglicht die Erzeugung von Spuren einer bestimmten Art über den Chat, also Drums, Bass und Akkordverbindungen mit entsprechenden Instrumenten.

Im Gegensatz zu AIVA ist Staccato aber nicht in der Lage, zusammenhängende Songs auf einmal zu erzeugen. Als Beispiel sind hier drei Ausgaben auf das Prompt „Create a simple EDM Track with beats bass and chords“ zu hören.

Das hört sich erstens mehr nach der Begleitautomatik einer Heimorgel an und zweitens hat es herzlich wenig mit EDM zu tun. Auch hier scheint kein tiefes „Wissen“ über das Genre vorhanden zu sein. Hier das Ergebnis des Prompts „Create a simple Drum And Bass Beat with 4 measures“

Abgesehen davon, dass am Anfang immer noch ein Überbleibsel des vorigen Prompts zu hören war (ich habe es für die Beispiele weggeschnitten), hat auch das hier weder in Instrumentation, noch Geschwindigkeit, noch Stil etwas mit meiner Prompt-Eingabe zu tun.

In aller Fairness besitzt Staccato aber nur dieses eine Plöp-Drum-Set, ein anderer Klang ist also von vornherein nicht möglich. Da aber die MIDI-Daten exportiert werden können, könnte später ein entsprechendes Drum-Set genutzt werden.

Nach dem Erzeugen gelangen wir in eine MIDI-Editor-Ansicht, in der mehrere Spuren gleichzeitig auf einer Pianorolle dargestellt werden können, wenn es mehrere Instrumente gibt. Eine echte DAW-Ansicht bietet Staccato nicht.

Es können nun mehrere Spuren angelegt werden. Aber jeglicher Versuch, irgendeine Kohärenz herzustellen, scheiterte. Auch wenn ich explizit einen Bass zum Beat erzeugen wollte: „create a bassline fitting the beat start at bar 1“, erzeugte Staccato oft einfach einen weiteren Beat, dazu veränderte sich auch noch der Beat auf der ersten Spur und nach einem Undo verschwand einfach alles aus der Ansicht.

Selbst wenn Staccato meine Anweisung ausführte, kam nicht selten so etwas dabei heraus.

Es gibt auch eine Extend-Funktion, die auf vorhandenem Material aufbauen soll – mir kommt sie eher wie eine agnostische Random-Funktion vor. Ich denke einfach, Staccato steht noch ganz am Anfang der Entwicklung und es sollte eher als public Alpha-Test bezeichnet werden. Dann sollte aber auch kein Geld vom Kunden fließen. Es bleibt abzuwarten, wie sich der Service in Zukunft entwickelt.