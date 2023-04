Mit ChatGPT durch den Musikeralltag

In der sich ständig weiterentwickelnden digitalen Landschaft suchen Musiker und Komponisten ständig nach innovativen Werkzeugen, um ihren kreativen Prozess zu verbessern und ihre künstlerischen Horizonte zu erweitern. Hier kommt ChatGPT ins Spiel, ein fortschrittliches Sprachmodell, das von OpenAI entwickelt wurde und sich als bahnbrechend in der Musikwelt herausstellt. ChatGPT nutzt die Leistungsfähigkeit künstlicher Intelligenz und eröffnet Musikern eine Fülle von Möglichkeiten, indem es ihnen einen vielseitigen und intelligenten Assistenten bietet, um Inspirationen zu entfachen, Ideen zu verfeinern und die Komplexitäten der Musikindustrie zu bewältigen. In diesem Artikel werden wir die vielfältigen Möglichkeiten untersuchen, wie ChatGPT die Art und Weise revolutionieren kann, wie Musiker kreativ arbeiten, zusammenarbeiten und sich mit ihrer Kunst auseinandersetzen und dabei nicht nur individuelle künstlerische Entwicklungen, sondern auch die gesamte musikalische Landschaft verändern. Machen Sie sich bereit, die Zukunft des Musikmachens mit ChatGPT zu entdecken, wo KI und Kreativität harmonisch zusammenfließen (hoffentlich).

Was ist ChatGPT?

ChatGPT ist ein Sprachassistent, der mit künstlicher Intelligenz arbeitet. GPT ist die Abkürzung für Generative Pretrained Transformer, was auch bereits die Funktionsweise von ChatGPT erklärt. ChatGPT ist ein Algorithmus auf Basis künstlicher Intelligenz, der mit Texten trainiert wurde, um dessen Inhalte zusammenzufassen, neu zu kombinieren, anzuwenden oder auf dieser Basis neue Texte zu generieren. Hier unterscheidet sich ChatGPT von einer Wissensdatenbank, in der Wissen gespeichert ist, das aber nur 1:1 nach einer Suche wiedergegeben werden kann.

Entwickelt wird ChatGPT von OpenAI, einem amerikanischen Unternehmen, das auf die Erforschung und Anwendung künstlicher Intelligenz spezialisiert ist. Der Öffentlichkeit vorgestellt wurde ChatGPT Ende November 2022 und war sofort ein durchschlagender Erfolg. Innerhalb der ersten Tage wurde die Marke von 1 Million Anwender geknackt, die sich selbst von den Möglichkeiten von ChatGPT einen Eindruck verschaffen wollten. Dabei ist ChatGPT der Nachfolger und eine Weiterentwicklung von InstructGPT. Zur Weiterentwicklung von ChatGPT wurde Microsoft ins Boot geholt, die als Geldgeber und Nutznießer gleichermaßen die Entwicklung mit 10 Milliarden US-Dollar fördern. ChatGPT wurde mittlerweile in die Microsoft Search Engine Bing integriert, was sofort Google auf den Plan rief, die Marktanteile schwinden sahen und mit einem eigenen Sprachassistenten auf Basis einer KI versuchen, die eigene Marktmacht zu erhalten. Erste Versuche vor der Presse endeten jedoch für Google in einem Desaster. Auch Apple arbeitet an einer KI für den Sprachassistenten Siri.

ChatGPT 3.5 ist kostenlos verfügbar, während das kürzlich vorgestellte ChatGPT 4.0 ChatGPT Plus-Anwendern vorbehalten ist. Die Mitgliedschaft kostet derzeit 20,- US-Dollar im Monat.

ChatGPT 4.0 soll dabei eine noch größere Genauigkeit hinsichtlich der Antworten bieten, kann längere Texte verarbeiten (bis zu 25.000 Wörter) und auch Bilder analysieren. Im Internet schwirren mittlerweile zahlreiche Videos herum, die komplette Kompositionen von ChatGPT zeigen sollen.

Ich habe mir angeschaut, was ChatGPT kann und versucht, einige der gezeigten Experimente nachzuvollziehen.

ChatGPT 3.5 und ChatGPT 4.0 – die Sprachspezialisten

Eine Sache vorweg: auch ChatGPT 4.0 ist und bleibt ein Sprachspezialist. ChatGPT 4.0 kann nach wie vor keine Suchanfragen ausführen und ist wenig multimedial. Alle Eingaben und Ausgaben erfolgen in Form von Sprache, wie das Wort „Chat“ schon vermuten lässt. Stellt man ChatGPT eine Aufgabe oder eine Frage, so erhält man innerhalb von Sekunden eine Antwort. Zu beurteilen, ob diese korrekt ist, liegt beim Anwender. ChatGPT reagiert auf weitere Nachfragen und stellt automatisch Verbindungen zu allem her, was zuvor im Chat gesagt und beantwortet wurde. So lässt sich zum Beispiel nach und nach ein Text entwickeln. So wurde zum Beispiel die Einleitung dieses Artikels bis auf das letzte Wort in Klammern („hoffentlich“) von ChatGPT geschrieben. Die Anweisung an ChatGPT (3.5) lautete, eine Einleitung zu einem Fachartikel über den Nutzen eines KI Sprachassistenten wie ChatGPT für die Musikproduktion zu verfassen. Der oben abgedruckte Text ist der erste Versuch, der ohne weitere Nachfragen entstanden ist.

Möchte man ChatGPT 3.5 oder 4.0 für das Musizieren nutzbar machen, müssen also alle Aufgaben als Sprachbefehl gestellt werden. Die Antwort erhält man natürlich auch in Textform. Es gibt keine Bilder, keine Töne, nur Text. Diesen gilt es dann, in das entsprechend gewünschte Format zu übersetzen. Wie gut das gelingt, hängt in erster Linie vom Anwender selbst ab.

Ich habe über den Verlauf mehrerer Wochen ChatGPT mit Daten rund um das Thema Musik gefüttert und die Antworten gesammelt.

Ist der Einsatz von ChatGPT für Musiker sinnvoll?

Doch wie kann ChatGPT Musikern konkret helfen. Fragen wir doch mal nach:

Das ist doch schon eine sehr konkrete Antwort. Einige dieser Punkte habe ich im Folgenden abgearbeitet, um zu überprüfen, ob ChatGPT tatsächlich eine Hilfe sein kann.

Test 1: ChatGPT und Musiktheorie

Während ChatGPT 3.5 noch vor einigen Wochen noch die Frage, was eine Triole ist, falsch beantwortet hat, geben nun beide Versionen die folgende Antwort:

Das liest sich schon einmal sehr gut und ist nun auch korrekt. Probieren wir es mit einem anderen Thema aus dem Bereich der Harmonielehre:

Die Herleitung ist korrekt und gut nachvollziehbar. Nun habe ich mich auf das Ergebnis bezogen und eine weitere Aufgabe gestellt:

Auch das ist korrekt. ChatGPT 3.5 und 4 sind also ohne Probleme in der Lage, Akkorde in die Stufentheorie zu überführen und auch zu transponieren. Das könnte durchaus in der Praxis hilfreich sein, wenn man ChatGPT zum Beispiel mit einem Chord Sheet füttert, um dieses in eine andere Tonart transponieren zu lassen oder in die allgemeinere Stufenschreibweise zu übersetzen. Neugierig wollte ich wissen, ob das auch mit der Funktionstheorie geht:

Das Beispiel oben zeigt, dass hier ChatGPT schon an seine Grenzen stößt. Beide Versionen geben die falsche Antwort und korrigieren diese nach einer Hilfestellung durch mich, gelangen dann aber immerhin zur richtigen Antwort. Ich habe diesen Versuch einige Tage später wiederholt. Erneut gibt ChatGPT 4 im ersten Anlauf zwar einige korrekte Funktionsbezeichnungen für einige der Akkorde aus, schreibt die Akkordfolge schließlich aber als Stufen auf und nicht in Funktionen. Nach einer kleinen Erinnerung, was denn die Stufenbezeichnungen sind, erhalte ich die korrekte Antwort. Das zeigt, dass sich der Nutzer nicht auf die Korrektheit der Antwort verlassen darf.

Test 2: Werkanalyse und Vergleich

In US-Tests hat ChatGPT 4 sehr erfolgreich das als sehr schwer geltende „Bar Exam“ für Juristen abgelegt und ist dabei in den Top 10 der besten Absolventen gelandet. Wie sieht es mit einer typischen Aufgabe aus einer Musikklausur in der Oberstufe aus?

Das ist toll formuliert, aber noch nicht sehr konkret, liefert aber Schülern schon einen sehr konkreten Anhaltspunkt für die weitere Analyse. Dies könnte schon ein guter Klausureinstieg oder ein Einstieg für eine mündliche Abiturprüfung sein. Aber wie sieht es mit der harmonischen Analyse aus? Starten wir einfach und lassen ChatGPT die ersten fünf Takte analysieren. Das Ergebnis ist korrekt und sieht so aus:

Anders sieht es mit der Analyse der Takte 6 und 7 aus. Hier steht bei Bach ein D7-Akkord, gefolgt von einem G7-Akkord, was in der Funktion die Doppeldominante mit kleiner Septime gefolgt vom Dominantseptakkord wäre. ChatGPT 4 missachtet das Versetzungszeichen (aus dem Ton f wird ein fis) und erkennt deshalb anstelle eines Dur-Akkords in Takt 6 einen Dm7-Akkord und bezeichnet diesen als Subdominantparallele mit kleiner Septime. Nach der Erinnerung, dass in Takt 6 ein Versetzungszeichen zu finden ist, nimmt ChatGPT 4.0 einen weiteren Anlauf und macht aus dem Ton a ein as. Erneut ist die Analyse deshalb nicht korrekt. Erst nach dem Hinweis, dass sich in Takt 6 der Ton fis findet, ist die Analyse korrekt:

Es bedarf zweier weiterer Nachfragen, um ChatGPT 4.0 die Bezeichnung „Doppeldominante“ zu entlocken, die garantiert jeder Lehrer in einer Prüfung vom Schüler hören möchte. Erneut zeigt sich, dass der kritische Umgang mit den ChatGPT-Antworten wichtig ist. Ohne etwas Grundwissen geht es dann doch nicht. Es ist schon fast ironisch, dass ChatGPT ausgerechnet ein Versetzungszeichen missachtet, ein Fehler, den auch viele Schüler in solchen Prüfungsaufgaben gerne machen.

Test 3: Unterrichtsplanung einer Musikstunde

Das ist ein guter Unterrichtsplan, der durchaus der Realität entspricht. ChatGPT 4.0 lieferte hier einen ähnlichen Plan wie ChatGPT 3.5, der allerdings die Zeit von 30 Minuten überschreitet, wenn man mal die Zeitangaben von ChatGPT zusammenrechnet. Allerdings ist er deutlich konkreter als der Plan der Version 3.5. Hier die Wiedergabe des Chat-Verlaufs:

Ich habe einen neuen Klavierschüler. Ich muss ihm die erste Unterrichtsstunde geben. Was sollte ich in 30 Minuten mit ihm behandeln?

Für die erste Klavierstunde mit einem neuen Schüler möchten Sie einige grundlegende Konzepte und Techniken vermitteln, um ihnen den Einstieg in das Instrument zu erleichtern. Hier ist ein Vorschlag für den Ablauf einer 30-minütigen Unterrichtsstunde:

Einleitung (2-3 Minuten)

Begrüße den Schüler und lerne ihn kurz kennen.

Frage nach ihrem musikalischen Hintergrund, falls vorhanden, und ihren Zielen beim Klavierspielen.

Haltung und Handposition (5 Minuten)

Zeige dem Schüler, wie man am Klavier sitzt, mit den Füßen flach auf dem Boden und dem Rücken gerade.

Erkläre die richtige Handposition: entspannt, mit gekrümmten Fingern und leicht erhobenen Handgelenken.

Lass den Schüler üben, die Hände auf die Tasten zu legen und die richtige Haltung beizubehalten.

Einführung in die Klaviatur (5 Minuten)

Erkläre das Layout der Klaviatur, einschließlich des Musters aus weißen und schwarzen Tasten.

Führe das Konzept der Oktaven ein und zeige, wie man das mittlere C identifiziert.

Grundlegende Fingerübungen (5 Minuten)

Bringe dem Schüler eine einfache Fünf-Finger-Übung oder Skala (z. B. C-Dur) bei, um ihm zu helfen, sich mit den Tasten vertraut zu machen und die Fingerkraft und Geschicklichkeit zu entwickeln.

Ermutige den Schüler, langsam und gleichmäßig zu spielen und dabei die richtige Handposition beizubehalten.

Einführung in die musikalische Notation (5 Minuten)

Erkläre die Grundlagen des Notenlesens, einschließlich Notensystem, Schlüssel und Notennamen.

Führe Notenwerte (Ganze, Halbe, Viertel- und Achtelnoten) und Pausen ein.

Einfache Rhythmusübungen (3 Minuten)

Klatsche oder tippe einfache Rhythmen mit dem Schüler, um ihm zu helfen, ein Gefühl für Timing und Puls zu entwickeln.

Erlernen eines einfachen Stücks oder Lieds (4-5 Minuten)

Bringe dem Schüler ein einfaches, bekanntes Stück oder Lied bei, wie z. B. „Bruder Jakob“ oder „Alle meine Entchen“, entweder mit Noten oder auswendig.

Hilf dem Schüler, das Stück langsam und genau zu üben.

Zusammenfassung und Hausaufgaben (1-2 Minuten)

Wiederhole die im Unterricht behandelten Konzepte und beantworte eventuelle Fragen des Schülers.

Weise Übungsaufgaben für den Schüler zu, an denen er zwischen den Stunden arbeiten soll, wie z. B. Fingerübungen, Rhythmusübungen und das Üben des erlernten Stücks.

Denke daran, den Unterricht interessant und unterhaltsam für den Schüler zu gestalten und dein Tempo und deine Inhalte an sein Alter, seine Fähigkeiten und seine Interessen anzupassen.

Allerdings machte ChatGPT 4.0 noch konkrete Liedvorschläge. Er wäre eher für 45 Minuten geeignet und die Liedvorschäge übersteigen den Fünftonraum, weshalb sie für die erste Stunde weniger geeignet sind. Schön ist der letzte Hinweis, den Unterricht interessant und unterhaltsam zu gestalten.

Außerdem habe ich mir für die Planung von Unterrichtsstunden für einen fortgeschrittenen E-Gitarrenschüler von ChatGPT Stücke aus dem Bereich Heavy Metal heraussuchen und nach Schwierigkeitsgrad sortieren lassen:

Da die Frage recht oberflächlich gestellt war und auch bei fortgeschrittenen Schülern die Unterschiede im individuellen Leistungsvermögen recht groß sein können, ist es besser, die Frage noch konkreter zu stellen. Wie das aussehen kann, seht ihr im folgenden Beispiel:

Das ist mehr als brauchbar und ich muss sagen, dass ich tatsächlich die Mehrzahl der Stücke mit meinen fortgeschrittenen E-Gitarrenschülern gespielt habe. In Sachen Unterrichtsvorbereitung kann ChatGPT damit eine große Hilfe sein. Beide ChatGPT-Versionen schneiden ähnlich gut ab, ChatGPT 4.0 liefert aber ohne weitere Nachfragen ausführlichere Antworten.

Test 4: Komposition mit ChatGPT

Ich habe mir ChatGPT auch über einen längeren Zeitraum im Bereich Komposition angeschaut. Kann man mit ChatGPT einen Song schreiben? Es gibt mehrere Videos auf YouTube, die genau das behaupten. Ich habe versucht, die dort gezeigten Schritte nachzuvollziehen und schon beim Anschauen der Videos wurde schnell klar, dass hier gewaltig nachgeholfen wurde. So ist es dann auch in meinem Test der Fall gewesen. Schon an einer guten Akkordfolge oder überhaupt Tonfolge scheitert ChatGPT in beiden Versionen gnadenlos. Fragt man, welche Skalen zu einer vorgegebenen Akkordfolge passen könnten, erhält man wenig aufregende Standardkost, sprich die Skalen, die die Akkordtöne enthalten. Im Wesentlichen wurde mir die entsprechende Dur- oder Moll-Tonleiter ausgegeben und im Prinzip die dazu gehörenden modalen Skalen, also das identische Tonmaterial von einem anderen Startton aus gespielt.

Da ChatGPT auch keine Notation beherrscht und alles in Text ausdrückt, maximal in einem Diagramm oder als Tabulatur ohne Rhythmusnotation, ist es Sache des Anwenders, das Ergebnis zu interpretieren und entsprechend in einer DAW oder einem Notensatzprogramm umzusetzen. Beim Erstellen von Tabulaturen macht ChatGPT viele Fehler.

Der Nutzen von ChatGPT im Bereich der Komposition ist noch sehr gering. Es gibt andere Tools, die das bereits besser beherrschen und darauf spezialisiert sind. Dennoch kann man ChatGPT zum Beispiel als Ideengeber für Songtexte nutzen. Dazu kann man bekannte Texte analysieren und auf der Basis ChatGPT neue Songtexte erstellen lassen. Oder man gibt einige Stichworte ein und ChatGPT erzeugt dazu einen Songtext. Auch die Vorgabe der Struktur, zum Beispiel der Strophenanzahl, Anzahl an Refrains, Bridge, Pre-Chorus etc. ist möglich. Die Ergebnisse sind manchmal lustig, manchmal aber auch inspirierend. Hier mal ein Beispiel der lustigen Sorte:

Dann wollen wir doch mal den Ärzten Konkurrenz machen und uns von ChatGPT 4.0 einen ähnlich tollen Songtext schreiben lassen. Ob das gelingt?

Interessant ist der Perspektivwechsel, den die KI vorgenommen hat. Während bei „Junge“ der Song aus Sicht der Eltern geschrieben ist, ist er hier aus der Sicht des Jugendlichen verfasst. Auch wenn der Text in der Form nicht wirklich brauchbar ist, sind einige nette Ideen enthalten. Allerdings sorgen Verse wie „Wir sind lauter als der Donner, der am Himmel zirpt“ wohl eher für Gelächter. Ein Vers wie „Wir träumen groß und laut, wollen alles erreichen“ ist hingegen gar nicht so schlecht. Einen kompletten Song wird man von der KI wohl eher nicht erstellen lassen, aber zur Ideenfindung kann man ChatGPT durchaus nutzen.

Test 5: Hilfestellung bei Apps/Fachwissen

ChatGPT ist in der Lage, Hilfestellungen zur Bedienung von Software oder auch Hardware zu geben. Ich habe das mit einfachen Aufgaben ausprobiert. Die Ergebnisse möchte ich hier nur kurz zusammenfassen. Fragen zum Beispiel zur Bedienung einer DAW werden zwar beantwortet, führen aber oft nicht zum Ziel, da sich entweder die Apps seit dem Ende der Trainingsphase schon deutlich weiterentwickelt haben oder aber die Hinweise oberflächlich bleiben oder irreführend sind. So wurden oft Bedienelemente beschrieben, die überhaupt nicht existieren. Die Anleitungen zum Erstellen eines Shimmer Reverbs in Logic Pro und in Ableton Live war wenig hilfreich. Immerhin war die Beschreibung der Funktionsweise eines Shimmer Reverbs richtig, sodass man mit einigen grundlegenden Kenntnissen der beiden DAWs wahrscheinlich zum Ziel gelangt wäre.

Besser funktionieren allgemeine Fragen zur Tontechnik, zum Beispiel habe ich eine brauchbare Antwort zum Einstellen des Kompressors für Gesang erhalten. Auch Hinweise zum Programmieren eines einfachen glockigen E-Piano Sounds am DX7 waren zielführend, wenn auch recht oberflächlich. Aber immerhin war es ein guter Startpunkt und nach dem Anpassen der Hüllkurven klang es wie ein E-Piano. Auch die Frage, wie ich einen einfachen Pad-Sound in Ableton Live erstellen kann, wurde bis auf Kleinigkeiten korrekt beantwortet und sogar das passende Software-Instrument vorgeschlagen.

Zum Thema FM habe ich mir gleich noch eine Tabelle aller jemals erschienenen FM-Synthesizer ausgeben lassen. Diese war im ersten Versuch recht lückenhaft. Weitere Nachfragen haben nach und nach die Tabelle gefüllt. Es sind aber immer wieder Synths in der Tabelle gelandet, die definitiv keine FM-Synths waren. Durch weitere Anmerkungen und Fragen wurden diese zwischenzeitlich aussortiert, später aber immer wieder einsortiert. Nach circa 10 Nachfragen und Aufforderungen zur Korrektur hat schließlich ChatGPT 4 die aussortierten Kawai K1, K1m, K4 und K5 Synthesizer zu Kurzweil-Geräten erklärt und sich durch nichts mehr dazu bewegen lassen, diese wieder aus der Tabelle zu entfernen. Störrisch ist sie also auch, die KI. Nun gut, bleibt zu hoffen, dass ChatGPT nun nicht für immer und ewig behauptet, dass diese Kawai Synths FM-Synthesizer von Kurzweil wären.

Dass das System tatsächlich lernt, kann man einfach überprüfen: Ich habe mit ChatGPT in bester Wargames-Tradition das Spiel „Tic Tac Toe“ gespielt. Ich habe ChatGPT 4.0 in jedem Durchgang besiegt. Nach jedem Sieg habe ich der KI erklärt, was sie falsch gemacht hat und welcher Weg zum Ziel geführt hätte. Dann habe ich das Spiel wiederholt. In jedem Durchgang hat sich ChatGPT 4.0 verbessert. Leider habe ich mit dem letzten Durchgang das Limit an Anfragen erreicht und konnte nicht abschließend überprüfen, ob ChatGPT 4.0 nun in der Lage wäre, jedes Spiel ins Unentschieden zu führen oder zu gewinnen. Ich musste den Versuch mit ChatGPT 3.5 weiterführen und diese KI ist deutlich weniger leistungsfähig. Während ChatGPT 4.0 sich mit jedem Zug verbessert hat, hat ChatGPT 3.5 nur rudimentäre Verbesserungen gezeigt. Fazit: ChatGPT 4.0 lernt zügig dazu, wir müssen aber die Apokalypse (noch) nicht fürchten.