ANZEIGE
ANZEIGE
ANZEIGE

Report: ChatGPT 4, ein Tool für Musiker?

Mit ChatGPT durch den Musikeralltag

3. April 2023
Report ChatGPT 4 ein Tool für Musiker

Report: ChatGPT 4, ein Tool für Musiker?

In der sich ständig weiterentwickelnden digitalen Landschaft suchen Musiker und Komponisten ständig nach innovativen Werkzeugen, um ihren kreativen Prozess zu verbessern und ihre künstlerischen Horizonte zu erweitern. Hier kommt ChatGPT ins Spiel, ein fortschrittliches Sprachmodell, das von OpenAI entwickelt wurde und sich als bahnbrechend in der Musikwelt herausstellt. ChatGPT nutzt die Leistungsfähigkeit künstlicher Intelligenz und eröffnet Musikern eine Fülle von Möglichkeiten, indem es ihnen einen vielseitigen und intelligenten Assistenten bietet, um Inspirationen zu entfachen, Ideen zu verfeinern und die Komplexitäten der Musikindustrie zu bewältigen. In diesem Artikel werden wir die vielfältigen Möglichkeiten untersuchen, wie ChatGPT die Art und Weise revolutionieren kann, wie Musiker kreativ arbeiten, zusammenarbeiten und sich mit ihrer Kunst auseinandersetzen und dabei nicht nur individuelle künstlerische Entwicklungen, sondern auch die gesamte musikalische Landschaft verändern. Machen Sie sich bereit, die Zukunft des Musikmachens mit ChatGPT zu entdecken, wo KI und Kreativität harmonisch zusammenfließen (hoffentlich).

ANZEIGE

Was ist ChatGPT?

chatgpt-4-screenshot-1

Willkommen zu ChatGPT

ChatGPT ist ein Sprachassistent, der mit künstlicher Intelligenz arbeitet. GPT ist die Abkürzung für Generative Pretrained Transformer, was auch bereits die Funktionsweise von ChatGPT erklärt. ChatGPT ist ein Algorithmus auf Basis künstlicher Intelligenz, der mit Texten trainiert wurde, um dessen Inhalte zusammenzufassen, neu zu kombinieren, anzuwenden oder auf dieser Basis neue Texte zu generieren. Hier unterscheidet sich ChatGPT von einer Wissensdatenbank, in der Wissen gespeichert ist, das aber nur 1:1 nach einer Suche wiedergegeben werden kann.

Entwickelt wird ChatGPT von OpenAI, einem amerikanischen Unternehmen, das auf die Erforschung und Anwendung künstlicher Intelligenz spezialisiert ist. Der Öffentlichkeit vorgestellt wurde ChatGPT Ende November 2022 und war sofort ein durchschlagender Erfolg. Innerhalb der ersten Tage wurde die Marke von 1 Million Anwender geknackt, die sich selbst von den Möglichkeiten von ChatGPT einen Eindruck verschaffen wollten. Dabei ist ChatGPT der Nachfolger und eine Weiterentwicklung von InstructGPT. Zur Weiterentwicklung von ChatGPT wurde Microsoft ins Boot geholt, die als Geldgeber und Nutznießer gleichermaßen die Entwicklung mit 10 Milliarden US-Dollar fördern. ChatGPT wurde mittlerweile in die Microsoft Search Engine Bing integriert, was sofort Google auf den Plan rief, die Marktanteile schwinden sahen und mit einem eigenen Sprachassistenten auf Basis einer KI versuchen, die eigene Marktmacht zu erhalten. Erste Versuche vor der Presse endeten jedoch für Google in einem Desaster. Auch Apple arbeitet an einer KI für den Sprachassistenten Siri.

ChatGPT 3.5 ist kostenlos verfügbar, während das kürzlich vorgestellte ChatGPT 4.0 ChatGPT Plus-Anwendern vorbehalten ist. Die Mitgliedschaft kostet derzeit 20,- US-Dollar im Monat.

chatgpt-screenshot-2

ChatGPT Plus Abonnenten können zwischen beiden Versionen wählen

ChatGPT 4.0 soll dabei eine noch größere Genauigkeit hinsichtlich der Antworten bieten, kann längere Texte verarbeiten (bis zu 25.000 Wörter) und auch Bilder analysieren. Im Internet schwirren mittlerweile zahlreiche Videos herum, die komplette Kompositionen von ChatGPT zeigen sollen.

Ich habe mir angeschaut, was ChatGPT kann und versucht, einige der gezeigten Experimente nachzuvollziehen.

ChatGPT 3.5 und ChatGPT 4.0 – die Sprachspezialisten

Eine Sache vorweg: auch ChatGPT 4.0 ist und bleibt ein Sprachspezialist. ChatGPT 4.0 kann nach wie vor keine Suchanfragen ausführen und ist wenig multimedial. Alle Eingaben und Ausgaben erfolgen in Form von Sprache, wie das Wort „Chat“ schon vermuten lässt. Stellt man ChatGPT eine Aufgabe oder eine Frage, so erhält man innerhalb von Sekunden eine Antwort. Zu beurteilen, ob diese korrekt ist, liegt beim Anwender. ChatGPT reagiert auf weitere Nachfragen und stellt automatisch Verbindungen zu allem her, was zuvor im Chat gesagt und beantwortet wurde. So lässt sich zum Beispiel nach und nach ein Text entwickeln. So wurde zum Beispiel die Einleitung dieses Artikels bis auf das letzte Wort in Klammern („hoffentlich“) von ChatGPT geschrieben. Die Anweisung an ChatGPT (3.5) lautete, eine Einleitung zu einem Fachartikel über den Nutzen eines KI Sprachassistenten wie ChatGPT für die Musikproduktion zu verfassen. Der oben abgedruckte Text ist der erste Versuch, der ohne weitere Nachfragen entstanden ist.

Möchte man ChatGPT 3.5 oder 4.0 für das Musizieren nutzbar machen, müssen also alle Aufgaben als Sprachbefehl gestellt werden. Die Antwort erhält man natürlich auch in Textform. Es gibt keine Bilder, keine Töne, nur Text. Diesen gilt es dann, in das entsprechend gewünschte Format zu übersetzen. Wie gut das gelingt, hängt in erster Linie vom Anwender selbst ab.

Ich habe über den Verlauf mehrerer Wochen ChatGPT mit Daten rund um das Thema Musik gefüttert und die Antworten gesammelt.

ANZEIGE

Ist der Einsatz von ChatGPT für Musiker sinnvoll?

Doch wie kann ChatGPT Musikern konkret helfen. Fragen wir doch mal nach:

chatgpt-will-musikern-helfen

So möchte ChatGPT Musikern helfen

Das ist doch schon eine sehr konkrete Antwort. Einige dieser Punkte habe ich im Folgenden abgearbeitet, um zu überprüfen, ob ChatGPT tatsächlich eine Hilfe sein kann.

Test 1: ChatGPT und Musiktheorie

Während ChatGPT 3.5 noch vor einigen Wochen noch die Frage, was eine Triole ist, falsch beantwortet hat, geben nun beide Versionen die folgende Antwort:

chatgpt-erklärt-triole

Nun weiß ChatGPT endlich auch, was eine Triole ist

Das liest sich schon einmal sehr gut und ist nun auch korrekt. Probieren wir es mit einem anderen Thema aus dem Bereich der Harmonielehre:

chatgpt-übersetzt-akkorde-in-stufenbezeichnungen

ChatGPT hat keine Probleme damit, eine beliebige Akkordfolge in die Stufenbezeichnungen der Stufentheorie zu überführen

Die Herleitung ist korrekt und gut nachvollziehbar. Nun habe ich mich auf das Ergebnis bezogen und eine weitere Aufgabe gestellt:

chatgpt-transponiert-akkorde

Auch der Weg zurück und die Übersetzung in eine andere Tonart funktioniert einwandfrei

Auch das ist korrekt. ChatGPT 3.5 und 4 sind also ohne Probleme in der Lage, Akkorde in die Stufentheorie zu überführen und auch zu transponieren. Das könnte durchaus in der Praxis hilfreich sein, wenn man ChatGPT zum Beispiel mit einem Chord Sheet füttert, um dieses in eine andere Tonart transponieren zu lassen oder in die allgemeinere Stufenschreibweise zu übersetzen. Neugierig wollte ich wissen, ob das auch mit der Funktionstheorie geht:

chatgpt-übersetzt-in-funktionstheorie-teil-1

Bei der Funktionstheorie hapert es noch etwas

chatgpt-übersetzt-in-funktionstheorie-teil-2

Nach etwas Nachhilfe funktioniert aber auch das

Das Beispiel oben zeigt, dass hier ChatGPT schon an seine Grenzen stößt. Beide Versionen geben die falsche Antwort und korrigieren diese nach einer Hilfestellung durch mich, gelangen dann aber immerhin zur richtigen Antwort. Ich habe diesen Versuch einige Tage später wiederholt. Erneut gibt ChatGPT 4 im ersten Anlauf zwar einige korrekte Funktionsbezeichnungen für einige der Akkorde aus, schreibt die Akkordfolge schließlich aber als Stufen auf und nicht in Funktionen. Nach einer kleinen Erinnerung, was denn die Stufenbezeichnungen sind, erhalte ich die korrekte Antwort. Das zeigt, dass sich der Nutzer nicht auf die Korrektheit der Antwort verlassen darf.

Test 2: Werkanalyse und Vergleich

In US-Tests hat ChatGPT 4 sehr erfolgreich das als sehr schwer geltende „Bar Exam“ für Juristen abgelegt und ist dabei in den Top 10 der besten Absolventen gelandet. Wie sieht es mit einer typischen Aufgabe aus einer Musikklausur in der Oberstufe aus?

chatgpt-analysiert-praeludium

Eine Analyseaufgabe für ChatGPT 4

Das ist toll formuliert, aber noch nicht sehr konkret, liefert aber Schülern schon einen sehr konkreten Anhaltspunkt für die weitere Analyse. Dies könnte schon ein guter Klausureinstieg oder ein Einstieg für eine mündliche Abiturprüfung sein. Aber wie sieht es mit der harmonischen Analyse aus? Starten wir einfach und lassen ChatGPT die ersten fünf Takte analysieren. Das Ergebnis ist korrekt und sieht so aus:

chatgpt-analysiert-praeludium-teil-2

ChatGPT analysiert die ersten Takte des Praeludiums

Anders sieht es mit der Analyse der Takte 6 und 7 aus. Hier steht bei Bach ein D7-Akkord, gefolgt von einem G7-Akkord, was in der Funktion die Doppeldominante mit kleiner Septime gefolgt vom Dominantseptakkord wäre. ChatGPT 4 missachtet das Versetzungszeichen (aus dem Ton f wird ein fis) und erkennt deshalb anstelle eines Dur-Akkords in Takt 6 einen Dm7-Akkord und bezeichnet diesen als Subdominantparallele mit kleiner Septime. Nach der Erinnerung, dass in Takt 6 ein Versetzungszeichen zu finden ist, nimmt ChatGPT 4.0 einen weiteren Anlauf und macht aus dem Ton a ein as. Erneut ist die Analyse deshalb nicht korrekt. Erst nach dem Hinweis, dass sich in Takt 6 der Ton fis findet, ist die Analyse korrekt:

chatgpt-analysiert-praeludium-teil-3

Erneut benötigt ChatGPT etwas Nachhilfe, korrigiert sich dann aber umgehend und gibt das richtige Ergebnis aus

Es bedarf zweier weiterer Nachfragen, um ChatGPT 4.0 die Bezeichnung „Doppeldominante“ zu entlocken, die garantiert jeder Lehrer in einer Prüfung vom Schüler hören möchte. Erneut zeigt sich, dass der kritische Umgang mit den ChatGPT-Antworten wichtig ist. Ohne etwas Grundwissen geht es dann doch nicht. Es ist schon fast ironisch, dass ChatGPT ausgerechnet ein Versetzungszeichen missachtet, ein Fehler, den auch viele Schüler in solchen Prüfungsaufgaben gerne machen.

Test 3: Unterrichtsplanung einer Musikstunde

chatgpt-plant-unterrichtsstunde

ChatGPT plant für mich die erste Klavierstunde eines neuen Schülers

chatgpt-plant-unterrichtsstunde-teil-2

Geht das auch mit Zeitangaben? Natürlich! ChatGPT 3.5 lieferte hier bessere Ergebnisse als die Version 4.0, deren Planung der Zeiten 30 Minuten deutlich überschritten hat

Das ist ein guter Unterrichtsplan, der durchaus der Realität entspricht. ChatGPT 4.0 lieferte hier einen ähnlichen Plan wie ChatGPT 3.5, der allerdings die Zeit von 30 Minuten überschreitet, wenn man mal die Zeitangaben von ChatGPT zusammenrechnet. Allerdings ist er deutlich konkreter als der Plan der Version 3.5. Hier die Wiedergabe des Chat-Verlaufs:

Ich habe einen neuen Klavierschüler. Ich muss ihm die erste Unterrichtsstunde geben. Was sollte ich in 30 Minuten mit ihm behandeln?

Für die erste Klavierstunde mit einem neuen Schüler möchten Sie einige grundlegende Konzepte und Techniken vermitteln, um ihnen den Einstieg in das Instrument zu erleichtern. Hier ist ein Vorschlag für den Ablauf einer 30-minütigen Unterrichtsstunde:

Einleitung (2-3 Minuten)

  • Begrüße den Schüler und lerne ihn kurz kennen.
  • Frage nach ihrem musikalischen Hintergrund, falls vorhanden, und ihren Zielen beim Klavierspielen.

Haltung und Handposition (5 Minuten)

  • Zeige dem Schüler, wie man am Klavier sitzt, mit den Füßen flach auf dem Boden und dem Rücken gerade.
  • Erkläre die richtige Handposition: entspannt, mit gekrümmten Fingern und leicht erhobenen Handgelenken.
  • Lass den Schüler üben, die Hände auf die Tasten zu legen und die richtige Haltung beizubehalten.

Einführung in die Klaviatur (5 Minuten)

  • Erkläre das Layout der Klaviatur, einschließlich des Musters aus weißen und schwarzen Tasten.
  • Führe das Konzept der Oktaven ein und zeige, wie man das mittlere C identifiziert.

Grundlegende Fingerübungen (5 Minuten)

  • Bringe dem Schüler eine einfache Fünf-Finger-Übung oder Skala (z. B. C-Dur) bei, um ihm zu helfen, sich mit den Tasten vertraut zu machen und die Fingerkraft und Geschicklichkeit zu entwickeln.
  • Ermutige den Schüler, langsam und gleichmäßig zu spielen und dabei die richtige Handposition beizubehalten.

Einführung in die musikalische Notation (5 Minuten)

  • Erkläre die Grundlagen des Notenlesens, einschließlich Notensystem, Schlüssel und Notennamen.
  • Führe Notenwerte (Ganze, Halbe, Viertel- und Achtelnoten) und Pausen ein.

Einfache Rhythmusübungen (3 Minuten)

  • Klatsche oder tippe einfache Rhythmen mit dem Schüler, um ihm zu helfen, ein Gefühl für Timing und Puls zu entwickeln.

Erlernen eines einfachen Stücks oder Lieds (4-5 Minuten)

  • Bringe dem Schüler ein einfaches, bekanntes Stück oder Lied bei, wie z. B. „Bruder Jakob“ oder „Alle meine Entchen“, entweder mit Noten oder auswendig.
  • Hilf dem Schüler, das Stück langsam und genau zu üben.

Zusammenfassung und Hausaufgaben (1-2 Minuten)

  • Wiederhole die im Unterricht behandelten Konzepte und beantworte eventuelle Fragen des Schülers.
  • Weise Übungsaufgaben für den Schüler zu, an denen er zwischen den Stunden arbeiten soll, wie z. B. Fingerübungen, Rhythmusübungen und das Üben des erlernten Stücks.

Denke daran, den Unterricht interessant und unterhaltsam für den Schüler zu gestalten und dein Tempo und deine Inhalte an sein Alter, seine Fähigkeiten und seine Interessen anzupassen.

Allerdings machte ChatGPT 4.0 noch konkrete Liedvorschläge. Er wäre eher für 45 Minuten geeignet und die Liedvorschäge übersteigen den Fünftonraum, weshalb sie für die erste Stunde weniger geeignet sind. Schön ist der letzte Hinweis, den Unterricht interessant und unterhaltsam zu gestalten.

Außerdem habe ich mir für die Planung von Unterrichtsstunden für einen fortgeschrittenen E-Gitarrenschüler von ChatGPT Stücke aus dem Bereich Heavy Metal heraussuchen und nach Schwierigkeitsgrad sortieren lassen:

chatgpt-musikunterricht-teil-1

Du hast keinen Plan, was du mit deinem Schüler spielen sollst? Frag ChatGPT!

chatgpt-musikunterricht-teil-2

Und dann noch sortiert nach dem Schwierigkeitsgrad

Da die Frage recht oberflächlich gestellt war und auch bei fortgeschrittenen Schülern die Unterschiede im individuellen Leistungsvermögen recht groß sein können, ist es besser, die Frage noch konkreter zu stellen. Wie das aussehen kann, seht ihr im folgenden Beispiel:

chatgpt-musikunterricht-teil-3

Nach der Beschreibung der Techniken, die der Schüler beherrscht, bekam ich folgende Liste aus dem Bereich Rockmusik

Das ist mehr als brauchbar und ich muss sagen, dass ich tatsächlich die Mehrzahl der Stücke mit meinen fortgeschrittenen E-Gitarrenschülern gespielt habe. In Sachen Unterrichtsvorbereitung kann ChatGPT damit eine große Hilfe sein. Beide ChatGPT-Versionen schneiden ähnlich gut ab, ChatGPT 4.0 liefert aber ohne weitere Nachfragen ausführlichere Antworten.

Test 4: Komposition mit ChatGPT

Ich habe mir ChatGPT auch über einen längeren Zeitraum im Bereich Komposition angeschaut. Kann man mit ChatGPT einen Song schreiben? Es gibt mehrere Videos auf YouTube, die genau das behaupten. Ich habe versucht, die dort gezeigten Schritte nachzuvollziehen und schon beim Anschauen der Videos wurde schnell klar, dass hier gewaltig nachgeholfen wurde. So ist es dann auch in meinem Test der Fall gewesen. Schon an einer guten Akkordfolge oder überhaupt Tonfolge scheitert ChatGPT in beiden Versionen gnadenlos. Fragt man, welche Skalen zu einer vorgegebenen Akkordfolge passen könnten, erhält man wenig aufregende Standardkost, sprich die Skalen, die die Akkordtöne enthalten. Im Wesentlichen wurde mir die entsprechende Dur- oder Moll-Tonleiter ausgegeben und im Prinzip die dazu gehörenden modalen Skalen, also das identische Tonmaterial von einem anderen Startton aus gespielt.

Da ChatGPT auch keine Notation beherrscht und alles in Text ausdrückt, maximal in einem Diagramm oder als Tabulatur ohne Rhythmusnotation, ist es Sache des Anwenders, das Ergebnis zu interpretieren und entsprechend in einer DAW oder einem Notensatzprogramm umzusetzen. Beim Erstellen von Tabulaturen macht ChatGPT viele Fehler.

Der Nutzen von ChatGPT im Bereich der Komposition ist noch sehr gering. Es gibt andere Tools, die das bereits besser beherrschen und darauf spezialisiert sind. Dennoch kann man ChatGPT zum Beispiel als Ideengeber für Songtexte nutzen. Dazu kann man bekannte Texte analysieren und auf der Basis ChatGPT neue Songtexte erstellen lassen. Oder man gibt einige Stichworte ein und ChatGPT erzeugt dazu einen Songtext. Auch die Vorgabe der Struktur, zum Beispiel der Strophenanzahl, Anzahl an Refrains, Bridge, Pre-Chorus etc. ist möglich. Die Ergebnisse sind manchmal lustig, manchmal aber auch inspirierend. Hier mal ein Beispiel der lustigen Sorte:

chatgpt-analysiert-das-thema-eines-songs

ChatGPT 4.0 weiß also schon einmal, worum es in dem Lied „Junge“ geht

Dann wollen wir doch mal den Ärzten Konkurrenz machen und uns von ChatGPT 4.0 einen ähnlich tollen Songtext schreiben lassen. Ob das gelingt?

chatgpt-songtext-teil-1 chatgpt-songtext-teil-2

Interessant ist der Perspektivwechsel, den die KI vorgenommen hat. Während bei „Junge“ der Song aus Sicht der Eltern geschrieben ist, ist er hier aus der Sicht des Jugendlichen verfasst. Auch wenn der Text in der Form nicht wirklich brauchbar ist, sind einige nette Ideen enthalten. Allerdings sorgen Verse wie „Wir sind lauter als der Donner, der am Himmel zirpt“ wohl eher für Gelächter. Ein Vers wie „Wir träumen groß und laut, wollen alles erreichen“ ist hingegen gar nicht so schlecht. Einen kompletten Song wird man von der KI wohl eher nicht erstellen lassen, aber zur Ideenfindung kann man ChatGPT durchaus nutzen.

Test 5: Hilfestellung bei Apps/Fachwissen

ChatGPT ist in der Lage, Hilfestellungen zur Bedienung von Software oder auch Hardware zu geben. Ich habe das mit einfachen Aufgaben ausprobiert. Die Ergebnisse möchte ich hier nur kurz zusammenfassen. Fragen zum Beispiel zur Bedienung einer DAW werden zwar beantwortet, führen aber oft nicht zum Ziel, da sich entweder die Apps seit dem Ende der Trainingsphase schon deutlich weiterentwickelt haben oder aber die Hinweise oberflächlich bleiben oder irreführend sind. So wurden oft Bedienelemente beschrieben, die überhaupt nicht existieren. Die Anleitungen zum Erstellen eines Shimmer Reverbs in Logic Pro und in Ableton Live war wenig hilfreich. Immerhin war die Beschreibung der Funktionsweise eines Shimmer Reverbs richtig, sodass man mit einigen grundlegenden Kenntnissen der beiden DAWs wahrscheinlich zum Ziel gelangt wäre.

Besser funktionieren allgemeine Fragen zur Tontechnik, zum Beispiel habe ich eine brauchbare Antwort zum Einstellen des Kompressors für Gesang erhalten. Auch Hinweise zum Programmieren eines einfachen glockigen E-Piano Sounds am DX7 waren zielführend, wenn auch recht oberflächlich. Aber immerhin war es ein guter Startpunkt und nach dem Anpassen der Hüllkurven klang es wie ein E-Piano. Auch die Frage, wie ich einen einfachen Pad-Sound in Ableton Live erstellen kann, wurde bis auf Kleinigkeiten korrekt beantwortet und sogar das passende Software-Instrument vorgeschlagen.

Zum Thema FM habe ich mir gleich noch eine Tabelle aller jemals erschienenen FM-Synthesizer ausgeben lassen. Diese war im ersten Versuch recht lückenhaft. Weitere Nachfragen haben nach und nach die Tabelle gefüllt. Es sind aber immer wieder Synths in der Tabelle gelandet, die definitiv keine FM-Synths waren. Durch weitere Anmerkungen und Fragen wurden diese zwischenzeitlich aussortiert, später aber immer wieder einsortiert. Nach circa 10 Nachfragen und Aufforderungen zur Korrektur hat schließlich ChatGPT 4 die aussortierten Kawai K1, K1m, K4 und K5 Synthesizer zu Kurzweil-Geräten erklärt und sich durch nichts mehr dazu bewegen lassen, diese wieder aus der Tabelle zu entfernen. Störrisch ist sie also auch, die KI. Nun gut, bleibt zu hoffen, dass ChatGPT nun nicht für immer und ewig behauptet, dass diese Kawai Synths FM-Synthesizer von Kurzweil wären.

Dass das System tatsächlich lernt, kann man einfach überprüfen: Ich habe mit ChatGPT in bester Wargames-Tradition das Spiel „Tic Tac Toe“ gespielt. Ich habe ChatGPT 4.0 in jedem Durchgang besiegt. Nach jedem Sieg habe ich der KI erklärt, was sie falsch gemacht hat und welcher Weg zum Ziel geführt hätte. Dann habe ich das Spiel wiederholt. In jedem Durchgang hat sich ChatGPT 4.0 verbessert. Leider habe ich mit dem letzten Durchgang das Limit an Anfragen erreicht und konnte nicht abschließend überprüfen, ob ChatGPT 4.0 nun in der Lage wäre, jedes Spiel ins Unentschieden zu führen oder zu gewinnen. Ich musste den Versuch mit ChatGPT 3.5 weiterführen und diese KI ist deutlich weniger leistungsfähig. Während ChatGPT 4.0 sich mit jedem Zug verbessert hat, hat ChatGPT 3.5 nur rudimentäre Verbesserungen gezeigt. Fazit: ChatGPT 4.0 lernt zügig dazu, wir müssen aber die Apokalypse (noch) nicht fürchten.

ANZEIGE
Fazit

ChatGPT ist ein vielversprechendes Werkzeug, das sich in verschiedenen Bereichen einsetzen lässt. Im Bereich der Musikproduktion zeigt es sowohl Stärken als auch Schwächen. Es ist gut geeignet als Ideengeber und kann musikalische Probleme zufriedenstellend analysieren, was es zu einem wertvollen Begleiter für Musiker und Produzenten macht. Allerdings ist ChatGPT in anderen Bereichen, wie dem Komponieren von Musik, noch nicht fortgeschritten und seine Songtexte neigen dazu, eher humorvoll als tiefgründig zu sein. Daher ist ChatGPT bedingt geeignet für den Einsatz in der Musikproduktion und sollte vor allem als Inspirationsquelle und Analysewerkzeug genutzt werden.

Dieses Fazit hat ChatGPT 4 selbst verfasst und lässt sich von mir nur unterschreiben. Wer ChatGPT 3.5 ausprobieren möchte, kann das kostenlos tun, wird sich aber über die vielen Meldungen über Überlastungen ärgern. Auch das kostenpflichtige ChatGPT 4 ist derzeit nur eingeschränkt nutzbar. Zurzeit sind maximal 25 Anfragen innerhalb von vier Stunden zulässig und es erscheint bereits ein Hinweis, dass diese Zahl in der kommenden Woche voraussichtlich weiter reduziert wird. Sehr ärgerlich, wenn man bedenkt, dass man 20,- Dollar für die Nutzung zahlt.

Preis

  • kostenlos / 20 USD für ChatGPT Plus
ANZEIGE
Forum
  1. Profilbild
    Trichter

    Der Stand der Technik ist schon ziemlich gruselig.
    Allmählich kommen wir in Gefilde von Star Trek.

    Habe aus Spaß mal nach einer Analyse des Prelude in D von Bach für Cello gefragt und ob ChatGPT mir was ähnliches in C Moll in Gitarrentabulatur ausgeben kann. Da kamen wirklich ein paar Takte. Muss ich heute Abend erstmal spielen um zu hören wie das klingt, aber auf den ersten Blick sieht es ok aus.

    • Profilbild
      Markus Galla RED

      @Trichter Bei Tabulaturen muss man oft korrigieren. Die meisten Ergebnisse sind unbrauchbar. Zumindest auf meiner Gitarre gibt es keine negativen Bünde. Manchmal schafft man es, ChatGPT zu einer Korrektur zu bewegen, oft aber eben auch nicht. Der Weg ist noch weit.

      • Profilbild
        shapemodulator

        @Markus Galla Musikalisch ist die KI noch nicht, mich würde interessieren wie gut er mixen/mastern kann, das müsste ja besser klappen!

        • Profilbild
          mort76

          @shapemodulator Da gibts ja schon spezialisierte Tools mit KI.
          Und man bräuchte ja erstmal eine Schnittstelle zur DAW.

  2. Profilbild
    mfk AHU

    „Als KI-Chatbot ist ChatGPT äußerst nützlich, da er in der Lage ist, eine Vielzahl von Fragen zu beantworten und eine Fülle von Informationen zu liefern. ChatGPT kann auch als unterhaltsame Gesprächspartnerin dienen und interessante Konversationen zu verschiedenen Themen führen.
    Eine der Grenzen von ChatGPT ist jedoch, dass er nicht über menschliche Empathie und emotionale Intelligenz verfügt, die für bestimmte Arten von Interaktionen erforderlich sind. ChatGPT kann keine individuellen menschlichen Erfahrungen oder Emotionen verstehen und kann keine persönliche Beratung oder emotionale Unterstützung bieten.
    Ein weiteres Limit von ChatGPT ist, dass seine Antworten auf den von ihm trainierten Daten basieren. Wenn die Eingabeaufforderungen von den Daten abweichen, auf die er trainiert wurde, kann ChatGPT Schwierigkeiten haben, angemessene Antworten zu liefern. Außerdem kann ChatGPT nicht über das hinausgehen, was ihm beigebracht wurde.“

    Sagt ChatGPT, während ich Kaffee koche ;-)
    Das Programm kann die Suche nach der richtigen Wort-/Satzwahl beschleunigen.
    Sehr nützlich beim Schreiben von Briefen, die sowieso zu 90% aus Geplapper bestehen.
    Lustig sind die Grenzen. Am WE wollte ich einen positiven Text über die DB verfassen lassen.
    Es kam IMMER nur was Negatives raus. Datenbasis eben…

    • Profilbild
      shapemodulator

      @mfk ChatGPT2 oder ChatGPT4? ChatGPT4 ist da viel weiter, hat auch durchschnittlich gut sein Medizin Examen geschrieben…

      • Profilbild
        Markus Galla RED

        @shapemodulator Ich arbeite jetzt schon seit längerer Zeit mit beiden ChatGPT-Versionen (3.5 und 4) und muss sagen, dass die Unterschiede minimal sind. Oft greife ich lieber zu 3.5, weil es erheblich schneller ist. Zudem wurden viele Features, die für 4 versprochen wurden, noch gar nicht freigeschaltet. Auch ist die Datenbasis noch identisch. Zumindest behauptet ChatGPT 4 das. Und zwar schafft ChatGPT 4 ein Examen, TicTacToe kann es aber nicht. Das musste ich dem Teil erst beibringen 😂 Wir müssen also keine Angst haben, dass irgendwelche Atomraketen gestartet werden.

  3. Profilbild
    Bibbo

    Interessanter Artikel. Ich bin mal gespannt, wie Open AI auf Dauer die 20 Euro pro Monat rechtfertigen will, wenn es Googles Bard bald umsonst gibt. Letztere mag vielleicht im Beisein der Presse ein Desaster gewesen sein, liefert aber, nach allem, was man so hört, recht gute Ergebnisse.

    Was ich mich auch Frage ist, wie lange es wohl noch dauert, bis die Hersteller AI Funktionen in ihren DAWs integrieren. Wäre ja schon schön, wenn Ableton mir eine Reihe von ähnlich klingenden Kick Drum Samples vorschlägt, ohne dass ich lange danach suchen muss. Im Moment nutze ich dafür noch XO, aber das ist halt jedesmal mit zusätzlichen Klicks verbunden. Plugin öffnen, ggf. neuen Ordner hinzufügen, scannen, anhören, Favoriten sichern usw. usf. Das könnte man innerhalb der DAW eleganter lösen und die Zeitersparnis wäre enorm.

    • Profilbild
      Markus Galla RED

      @Bibbo Das wird alles sehr bald schon kommen. Gerade in solchen Anwendungen sehe ich eine große Stärke von KI. Erste Ansätze gibt es ja bereits. Ich vermute aber mal, dass die Entwickler zunächst einmal versuchen werden, den Computer und Smart Devices zugänglicher für Menschen zu machen. Gerade für ältere Menschen könnten Assistenten wie ChatGPT eine große Erleichterung im Umgang mit Computern darstellen. Sie können mit dem Computer „reden“, um ihn zu bedienen. Die Ankopplung von KI an Sprachassistenten wie Siri oder Alexa wird ein großer Fortschritt sein. OpenAI hat gerade die Entwicklung von Plugins für ChatGPT gestartet. So kann ChatGPT das Internet durchsuchen, auf Datensätze zugreifen und auch Anweisungen in Apps ausführen. Das wird die Nutzbarkeit deutlich erhöhen.

    • Profilbild
      Bibbo

      @Bibbo Neu in Live 12:

      „Try Live’s new Sound Similarity Search to find sounds with similar characteristics to the one you’re working on. Start with a sample and tell Live’s browser to find comparable sounds and instrument presets, with the help of a neural network.“

      Und btw: Google Bard gehört abgeschaltet. Das ist die Lügenmaschine schlechthin.

  4. Profilbild
    Markus Galla RED

    Kalauer des Morgens aus dem Homeoffice:

    Meine Frau: „Gibt es einen Shortcut in Adobe XD, um den Zoom auf 100 Prozent zurückzustellen?“
    Tipptipptipptipp
    Meine Frau: „Fragst du das jetzt ChatGPT?“
    Ich: „STRG+1 unter Windows, CMD+1 unter Mac“
    Meine Frau: „Funktioniert“

    Man muss das Tool nur sinnvoll zu nutzen wissen ;-)

  5. Profilbild
    mfk AHU

    Genrebegriff nebst Definition via ChatGPT:
    Es ging um eine Musikrichtung, die (m.W.) meistens als „Techno“ einsortiert wird.
    Hätte ich jetzt auch irgendwie hinbekommen, bin aber sehr zufrieden!

    Finde einen Genrebegriff für einen technoiden Musikstil mit Synkopen auf der Kickdrum-Spur.
    Verwende keine bekannten Genrebegriffe.

    „Ein möglicher Genrebegriff für diesen technoiden Musikstil mit Synkope auf der Kickdrum-Spur könnte „Synkotech“ sein.“

    „Die hypothetische Musikrichtung „Synkotech“ zeichnet sich durch einen starken Fokus auf synkopierte Rhythmen und ausgefeilte Technik aus. Die Beats werden durch die Verwendung von komplexen Schlagzeugmustern erzeugt, die die Zuhörer in eine hypnotische Trance versetzen. Die Klanglandschaften in „Synkotech“ sind futuristisch und oft von Synthesizern und anderen elektronischen Instrumenten erzeugt. Diese Musikrichtung beinhaltet auch häufig Klangexperimente und ungewöhnliche Klangformen, die den Hörer herausfordern und eine avantgardistische Atmosphäre erzeugen. Die BPM-Rate ist oft höher und der Klang ist oft hart und energetisch, was eine euphorische Stimmung und einen intensiven Tanzrhythmus erzeugt. „Synkotech“ ist eine Musikrichtung für Liebhaber von Techno, die nach etwas Neuem und Einzigartigem suchen, das sie in eine andere Welt entführt.“

    „hypothetisch“ ist ein Schlüsselwort um Grenzen auszureizen.

    • Profilbild
      Markus Galla RED

      @pestomusic Ja, habe das auch mit einem DX7-Patch ausprobiert. Das funktioniert schon „ganz“ gut. Ich schätze mal, dass man, wollte man bessere Ergebnisse erzielen, ChatGPT mit einer breiteren Datenbasis hinsichtlich FM-Synthese füttern müsste. Besser funktioniert das mit der subtraktiven Synthese.

  6. Profilbild
    Flowwater AHU

    Markus: Das ist ein sehr sehr SEHR geiler Artikel zum Thema ChatGPT und GPT-4. Hut ab und vielen lieben Dank für die Mühe, die Du Dir da gemacht hast. Echt jetzt: So etwas ist GOLD wert!

    Ich sehe anhand des Artikels ein riesiges Problem auf uns zukommen: Wie soll man als Laie erkennen, wenn ChatGPT eine falsche oder – noch schlimmer – teilweise unkorrekte Antwort gibt? Die Antwort auf diese Frage lautet für mich (bisher): Gar nicht! Man hat zunächst einmal keine Chance auf einfache Art zu verifizieren, ob ChatGPT – welche Version auch immer – evtl. Unsinn erzählt. Es sei denn, man befasst sich selber mit dem Thema … aber dann benötigt man ChatGPT nicht.

    Ich sehe schon eine Lawine in den sozialen Netzwerken auf uns zurollen, in denen evtl. falsche Aussagen von ChatGPT (und GTP-4) missbraucht und als allgemeines Wissen hingestellt werden. Das ChatGPT und GTP-4 im Moment überlastet sind … kann ich eigentlich nur begrüßen. So müssen die Leute dann doch mal ihren eigenen Grips anstrengen.

    Noch schlimmer finde ich – privat, persönlich, subjektiv – dass ChatGPT eben nichts neu »erfinden«, sondern vorhandenes Wissen »nur« wiedergeben und evtl. kombinieren kann … und genau das von den Nutzern missverstanden wird. Im Falle von Kompositionen heißt das im Extrem – wichtig (!) – für mich: Noch mehr selbstähnliche schnell produzierte Massenware im Radio.

    • Profilbild
      mfk AHU

      @Flowwater Es spielt keine Rolle, ob unsinnige Aussagen von Menschen oder von einer maschinellen Textgenerierung stammen. In der Tat sind die meisten unsinnigen Aussagen von Menschen und nicht von Maschinen, selbst in seriösen Medien und Diskussionen.

      Die ChatGPT-Maschine hat sogar wahrscheinlich höhere moralische Standards als viele Menschen.

      Das Auseinandernehmen und Wiederverwenden von Informationen ist eine menschliche Tradition und immer noch ein wichtiger Bestandteil der heutigen Kultur. Die meisten Geschichten und Kreationen haben ihre Wurzeln in den Erzählungen der Griechen und anderer antiker Kulturen.

      Warum jetzt eine „KI“ hier das Rad neu erfinden können soll, um Ansprüchen zu genügen, erschließt sich nicht.

    • Profilbild
      mmiimmimiiimmmiimmi

      @Flowwater „Ich sehe anhand des Artikels ein riesiges Problem auf uns zukommen: Wie soll man als Laie erkennen, wenn ChatGPT eine falsche oder – noch schlimmer – teilweise unkorrekte Antwort gibt? Die Antwort auf diese Frage lautet für mich (bisher): Gar nicht!“

      Quellenkritik muss durch den Leser IMMER erfolgen. Das Problem ist nicht neu und muss bei ChatGTP genauso berücksichtigt werden wie anderen Quellen, sei es mündliche Berichte, Bücher, Zeitungen, etc.

      • Profilbild
        CDRowell

        @mmiimmimiiimmmiimmi Bei einer Nutzung von cGPT wird meinst ein sehr neutraler, sowie analytischer Text erzeugt. Den kann man zum Glück bei ernsthaften Fragen durch andere Quellen verifizieren.😬 Das sollte inzwischen zum Standard eines jeden „ernsthaft wissenssuchenden, Fragenden“ gehören.😩

        Bedrohlicher empfinde ich, dass bei Firmen diese „KI-Chats“ den Kundenservice übernehmen.🤔 Was da bei unangenehmen Fragen, Problemen und Kritiken herauskommt, kann Mensch sicherlich erahnen.😈 – Wenn dann menschliche Belange mit Digitalem beantwortet werden, wird es zu einer Menge Kakophonien kommen, glaube ich…🤯

    • Profilbild
      Markus Galla RED

      @Flowwater Die Gefahr, dass Nutzer die Ergebnisse nicht verifizieren, ist natürlich gegeben. Ich würde mir hier Quellenangaben wünschen, so wie Microsoft BING das handhabt.

  7. Profilbild
    Fadermaster

    Sehr interessanter Artikel! Was KI bereits jetzt für Musiker tun kann zeigt auch das Sonible Pure Bundle mit seinen Tools für Mixing. Ich sehe die Stärke von KI darin, den Menschen zu unterstützen und nicht zu ersetzen.

    • Profilbild
      Markus Galla RED

      @Fadermaster Ja, das sehe ich auch so. Ich habe kürzlich einen sehr interessanten Bericht im Fernsehen aus Japan gesehen. Dort nutzt man KI, um eine Augenkrankheit sehr früh zu erkennen, die unbehandelt unweigerlich zur Blindheit führt. Ein Arzt kann die Erkrankung erst spät erkennen, weil er in den Bildern des Auges einen Pixelfehler nicht von der erkrankten Stelle unterscheiden kann. Die KI wertet die Aufnahmen aus und weist direkt darauf hin, wenn Symptome der Erkrankung für sie sichtbar sind. So kann die Behandlung eingeleitet werden und die Blindheit verhindert bis stark verzögert. Auch in der Krebsfrüherkennung setzt man in Japan bereits KI-Systeme ein.

      Die große Chance von KI sehe ich auch im Verknüpfen von Daten aus verschiedenen Datenquellen. Wir leben in einer Welt, in der viele Daten analog sind und viele Daten digital. Aber kaum etwas ist miteinander verknüpft. Das schränkt unser alltägliches Handeln deutlich ein. Eine KI wie ChatGPT, die in der Lage ist, nicht nur Scans per Texterkennung zu erfassen, sondern die erfassten Daten auch zu „verstehen“ und zu beurteilen, kann uns in Zukunft helfen, Daten nach dem Digitalisieren zu kategorisieren, Stichworte zu vergeben und schnell eine breite Datenbasis aus verschiedenen Quellen zu liefern, wenn wir eine Anfrage stellen.

  8. Profilbild
    Mattvank

    Die Kommentarfunktion braucht schon seit 2006 ein Update. Mittlerweile ist die Eskalation nicht mehr im Netz sondern wird in unsere Realwelt übertragen. Wenn Chatbots hier ein Gamechanger sind bzw. ein neuer Player, kann ich das nur begrüssen.

    Mir schwebt schon jetzt immer ein Hintergedanke wer oder was sich von Chat GPT hat was schreiben lassen. Auf Fans zu antworten ist auch so ein 24/7 Job. (Nicht bei mir:) )

    Auf jeden Fall eine gute Gelegenheit mehr back to the real Reality zu gehen. Jetzt müssen nur noch gute Synthietreffs in der Pampa stattfinden.

  9. Profilbild
    Eisenberg

    Kann man das Ding auch selbst mit Blödsinn füttern?
    Wer garantiert die Güte der Information, die da reingewandert ist?
    Kann der auch Pornos oder Katzenvideos generieren?
    Ich fürchte, das Ding wird ein weiterer Katalysator für die Verblödung der Massen.

  10. Profilbild
    AMAZONA Archiv

    KI wird die Musikproduktion ähnlich grundlegend und nachhaltig verändern wie damals der Computer. DAWs werden „smarter“ – Statt glorifizierter Bandmaschinen mit angehängtem Sequencer werden Sie den Nutzer aktiv beim Musikmachen unterstützen: Samples finden, Patches generieren, Akkordfolgen und Rhythmen vorschlagen, Routings erledigen. Solche Aufgaben wird in Zukunft auf Wunsch die DAW erledigen. Wie bei jedem Technologiesprung wird das einige erzürnen, andere werden sich bewusst enthalten, aber die breite Masse der „Hobbymusiker“ wird in 10, 20 Jahren ganz selbstverständlich KI-assistierte Musik machen. Und auch die Profis werden sich hier und da monotone Aufgaben vom virtuellen Assistenten abnehmen lassen, um schneller ans Ziel zu kommen. Als Technologie-affiner Mensch finde ich das aufregend und bin gespannt, was daraus für neue Ideen entstehen. Die kommen ja weiterhin vom Menschen selbst ;)

  11. Profilbild
    dirkolbrich

    Zum Problem mit Textausgabe und Notenschrift: man kann ChatGPT auch den Code für MIDI, MusicXML und Lillypond schreiben lassen.

  12. Profilbild
    tantris

    Auf youtube hat ein Benutzer ChatGPT über mehrere Dialogschritte dazu gebracht, den Code für ein VST-Plugin zu erstellen – inklusive einer graphischen Oberfläche für die Bedienknöpfe. Das ist schon sehr beachtlich.

  13. Profilbild
    Schallplan

    Als berufsmässiger Softwareentwickler und Einsteiger in die Entwicklung von Synth-Modulen habe ich versucht, chatGPT als Lernhilfe zu verwenden. Die Anfrage nach einer schnellen Implementierung der trigonometrischen tanh Funktion für die Programmiersprache C++ wurde auf den ersten Blick korrekt beantwortet und als Polynom 3. Grades erklärt. Der generierte Code berechnet jedoch einen Funktionsverlauf, der mit tanh nichts zu tun hat. Solange meine Fragen Antworten auf allgemeiner Ebene beantwortet wurden, waren die Antworten hilfreich, wie z.B. die Antwort auf die Frage welche anderen Sättigungsfunktionen ausser tanh noch verwendet werden, in der z.B. Soft-Clipping und Hard-Clipping genannt wurden. Sobald es aber um die Erstellung von Programmcode in C++ ging, waren die Beispiele korrekt, wenn sie trivial waren, z.B. direkter Aufruf der tanh Funktion und sonst fand ich sie eher unbrauchbar. Nach einigen Experimenten habe ich mich entschlossen, chatGPT nicht mehr zu diesem Zweck zu verwenden, sondern lieber weiter Fachbücher und Programmcode von anderen Entwicklern zu studieren.

    Hilfreich fand ich jedoch die Antworten auf die Frage nach einem typischen Aufbau von Psytrance Songs, den Unterschieden zwischen Goa-Trance und Psytrance sowie den wichtigsten Künstlern in beiden Genres.

  14. Profilbild
    AMAZONA Archiv

    Ich finde Maschine Learning großartig, besonders wenn es damit einfach möglich ist 0815 Musik, also z.B. ein typische Genres wie Ambient, Techno, Downtempo etc. mit ein paar Reglern generieren lassen zu können. Das spart sooo viel Zeit. Und den echten Künstler wird es nicht arbeitslos machen, denn die machen Tracks, die eben nicht 0815 sind. Ich hingegen bin schon froh wenn ich diese 0815 Tracks einigermaßen hinbekomme, egal ob jetzt vom Aufbau oder der Mischung ist.
    Ich hoffe, es kommen bald die Hammer AI-Produkte, wo ich einfach nur noch das Genre mit Reglern so anpasse, dass es für meine Sachen passt. Da erspare ich mir ganz viel Fummel Arbeit, denn das ganze Ausarrangieren und Mixen und Mastern macht mir keinen besonderen Spaß. Ich jamme viel lieber. Aber sobald es dann wirklich in Arbeit ausartet kann mich die KI gern unterstützen, oder auch die komplette Arbeit abnehmen. Ich freue mich tierisch auf die neue Technik und kann es kaum noch abwarten.

Kommentar erstellen

Die AMAZONA.de-Kommentarfunktion ist Ihr Forum, um sich persönlich zu den Inhalten der Artikel auszutauschen. Sich daraus ergebende Diskussionen sollten höflich und sachlich geführt werden. Politische Inhalte und Statements werden durch die Redaktion gelöscht.

Haben Sie eigene Erfahrungen mit einem Produkt gemacht, stellen Sie diese bitte über die Funktion Leser-Story erstellen ein. Für persönliche Nachrichten verwenden Sie bitte die Nachrichtenfunktion im Profil.

X
ANZEIGE X