Blog

Im letzten Jahr habe ich mich unter anderem viel mit KI-Tools beschäftigt - wie wohl viele andere ebenso. Ist ja auch eine faszinierende Zeit gerade, mit den ganzen Chatbots und Bild-, Video- und Musikgeneratoren. Da lassen sich für jedermann plötzlich Ideen umsetzen, die vor kurzem noch mangels Talent, Zeit oder benötigter Mittel gar nicht erst denkbar gewesen wären.

Durch die extrem niedrige Einstiegsschwelle für die große Masse erlebt man derzeit allerdings auch eine wahre Flut von AI-Slop, dem billig produzierten KI-Müll im Netz und auf Social Media. Da schickt mir dann auch schon mal der eigene Herr Erzeuger ungefragt und unkommentiert vermeintlich lustige oder interessante, KI-generierte Clips. Irgendwo auf Facebook oder wer-weiß-wo gefunden. Mich erinnert das ja ein kleines bisschen an den Internethype um 2000 rum - da wurde auch plötzlich jeder Hanswurst zum Webseiten-Designer dank Homepage-Baukästen von GeoCities, AOL & Co. Da hatte man dann auch ständig so "guck mal das an"-Links bekommen - und dann war das auch nur wieder irgendeine Unterseite auf home.t-online.de vom Kaninchenzuchtverein Grevenbroich o.ä., mit wenig Substanz aber dafür viel bunten Blinktext und vermeintlich lustigen GIFs. Ich denke damals wie heute haben einfach die meisten Leute schlicht weder Geschmack noch Anspruch und klicken mal schnell irgendeinen Unsinn zusammen. Im Unterschied zu früher ist heute aber die Masse der Leute viel größer und damit auch die Fülle an Blödsinn, die einem beim Browsen fast allgegenwärtig begegnet. Kein Wunder also, dass mancher einen regelrechten Hass auf KI-Content entwickelt und schon vornherein alles derartige ablehnt.
Dabei war das Internet schon immer ein großer Misthaufen - in dem es aber stets auch ein paar Perlen zu finden gibt. Und nur weil die meisten Leute banalen KI-Mist produzieren, müssen nicht auch die KI-Tools zwangsläufig Mist sein. Ich finde die Kluft zwischen totaler Ablehnung einerseits und der Begeisterung und völligem Vertrauen in KI-Output bei man anderem jedenfalls sehr spannend. Darum habe ich mich eingehender mit generativen KI-Tools beschäftigt, um mir selbst ein Bild zu verschaffen. Und zwar konkret in den letzten Monaten mit KI-Musik. Zumal ich da selbst etwas Vorbehalte hatte. Eines der aktuell relevantesten Tools für KI-generierte Musik ist Suno AI und war auch meine erste Wahl. Suno hat im Wesentlichen zwei Eingabefelder: eines, um die Lyrics, also den Text zum Lied einzugeben und eines um den Stil des Liedes zu definieren. Eine Eingabe wie

Hänschen klein
Ging allein
In die weite Welt hinein

und Heavy metal ergäbe dann beispielsweise eine etwas bizarre Neuinterpretation. Wenn man sich nun so durch die Werke der anderen Suno-Anwender durchhört, bekommt man durchaus schnell den Eindruck, dass die meisten es dann auch schon auf einem kaum höheren Niveau als das Hänschen-Beispiel belassen. Also einfach nur experimentieren und mit der KI etwas herumspielen. Die etwas ambitionierteren User feilen an den Prompts und generieren dutzende Songs, von denen dann einer irgendwann gut klingt. Und die noch anspruchsvolleren gehen in den Song-Editor und passen Teile eines Songs noch mal gezielt an oder laden sich die einzelnen Spuren (Gesang und Instrumente) einzeln zwecks eigener Nachbearbeitung herunter. Ab hier kostet der Spaß dann aber eine Abo-Gebühr, weshalb das wohl nicht die Masse der Anwender machen wird. Und spätestens bei den teureren Abo-Modellen, die es erlauben sich Songs als Midi-Spuren herunterzuladen um sie dann im eigenen Studio zu bearbeiten, verschwimmt zudem die Grenze zwischen generierter Musik und Musikselbermachen. Während dem LAN-Man-Projekt stieg ich in dieses Rabbit Hole und fand so sehr Gefallen daran, mir Liedtexte auszudenken und dann daraus komplette Songs zu erschaffen, dass ich mein Suno-Abo seither noch eine Weile fortführe und immer wieder mal Songs zum Spaß erstelle. Zuletzt hatte ich mich vor gefühlt tausend Jahren mit Song-Baukasten-Software wie MusicMaker an eigenen Liedern versucht und im Vergleich dazu ist diese Art von Musikmachen mit KI heute natürlich um Welten besser. Ein echter Musiker würde natürlich beides nicht als richtiges Musikmachen bezeichnen, aber als interessierter Laie sehe ich das pragmatischer: Musikmachen macht großen Spaß, aber zum einen habe ich gar keine Ambitionen plötzlich Musiker zu werden und andererseits ist der Weg um ein Instrument zu lernen, Noten zu lesen oder ein geübtes Gespür für passende Tonfolgen zu entwickeln wahrlich sehr lang. Zu lang, als dass ich solange andere Hobbies in den Hintergrund stellen wollen würde. Insofern sind Tools wie Suno perfekt, um Musikideen umzusetzen, die sonst entweder jahrelange Übung erfordern würden oder Geld um einen Musiker zu engagieren. Das KI-Resultat mag freilich nicht so gut sein, wie von richtigen, menschlichen Musikern. Allerdings wage ich zu behaupten, dass den Unterschied zwischen "echter" Musik und KI-Musik nur jemand heraushören kann, der entweder viel Erfahrung mit KI-Musik hat oder selbst Musiker ist. Vorausgesetzt natürlich, dass man schon auch einigermaßen Engagement in seine KI-Musik steckt. Ich gehe so vor, dass ich meine Songtexte erst in einem einfachen Texteditor selbst schreibe und auf reimsuche.de oder was-reimt-sich-auf.de nach Reimen für meine Verse suche. Für englischsprachige Songs gibt es ebenfalls Reim-Webseiten zuhauf. Und fällt einem mal absolut kein passender Reim auf ein Wort ein, kann man auch auf synonyme.woxikon.de nach einem Synonym suchen. Wenn ich in einem kreativen Loch stecke, oder mir einfach kein Einstieg einfällt, dann bitte ich ChatGPT z.B. um "Schreibe bitte einen Songtext mit vier Versen zum Thema XYZ. Verwende ein aabb-Reimschema. Achte darauf, dass sich die Verse bei deutscher Aussprache reimen. Denke dir einen passenden Refrain aus." Dabei kommt zwar oft Mist raus, aber wenigstens hat man dann einen roten Faden zum Loslegen.

Suno AI user interface — Ausschnitt aus dem Suno AI Benutzerinterface

Sobald der Text steht, eignet sich ChatGPT aber ganz gut um ein Stil-Prompt zu erstellen. In der Regel habe ich schon während dem Textschreiben eine ungefähre Vorstellung von der Art des Liedes und kann etwas dann vorgeben wie z.B.: "Schreibe ein Prompt auf Englisch für Suno AI für einen ruhigen, melancholischen Song, mit Gitarrenbegleitung im Stil früher deutscher Liedermacher wie Maffay oder Wader. Aber nenne im Prompt keine konkreten Künstlernamen oder Titel sondern beschränke dich auf stilistische Angaben." woraus dann so etwas wird: "A calm and melancholic song with gentle acoustic guitar accompaniment. The style should evoke introspective storytelling, with thoughtful, emotional lyrics and a warm, organic sound. Use simple but expressive melodies, subtle harmonies, and a reflective, slightly nostalgic mood. Focus on capturing the essence of classic singer-songwriter traditions, emphasizing heartfelt vocals and a contemplative atmosphere." Manchmal klingt das Resultat von Suno dann schon auf Anhieb recht gut, aber meist geht es dann erst richtig los mit dem Feinschliff weil man beim Hören dann doch noch irgendwo im Text ein anderes Wort besser findet, oder lieber noch ein Saxofon haben möchte, und so weiter... Ärgerlich ist es, wenn die KI ein fast perfektes Lied zaubert, aber dann ein einzelnes Wort falsch ausspricht. So zum Beispiel passiert beim Wort "Patient", den der KI-Sänger in einem deutschsprachigen Song aus unerfindlichen Gründen auf Englisch ausgesprochen hatte. Dann muss man in den Edit-Modus gehen und die Stelle neu generieren lassen, was meist frickelig und nervraubend ausartet. Im Großen und Ganzen macht diese Art des Musizierens aber ziemlich Spaß und mehr als ein paar Mal überraschte die KI mit verblüffend guten Resultaten, die mir ein breites, zufriedenes Grinsen bereiteten. So viel Spaß gar, dass ich im Weihnachtsurlaub eine ganze CD voll mit KI-Songs als Geburtstagsgeschenk für jemanden geschaffen habe. Hier eine Hörprobe aus dem Album:

Cypax - Die Rettungsgasse

Tja, interessant was so alles machbar ist. Wie das weitergehen wird, wer weiß? KI-Musik wird wohl auf die eine oder andere Art fortbestehen, zumal da das Ende der Entwicklung noch nicht erreicht ist. Und was künftig sicher vermehrt mit KI gemacht wird, sind Fälle wie "Ich brauche Hintergrundmusik für mein Video" oder "Ich will ein persönliches Geburtstagslied für meinen Opa".

Donnerstagabend am Küchentisch. Klagend erzählt mir unser Gast-Teenager von seinem ganzen Leid. Ein Buch sollen sie für die Englischprüfung lesen. Kapitel 1-9 und 11. Irgend ein Roman. "Ja, ok.", sage ich nickend und erwarte die Erläuterung, was denn nun das Problem sein soll. "Ja nix ok! Ich lese doch kein Buch!" empört er sich. Ich überlege, was ich dafür geben würde, mich einfach mal wieder ein paar Stunden ungestört auf dem Sofa in einen Wälzer zu vertiefen. Und darüber, warum ich im Alltag eigentlich nie Zeit dafür finde. Der bibliophobe Heranwachsende kommt derweil auf den Einfall "Ich lese einfach nur das Inhaltsverzeichnis". "Das wird wohl nicht reichen, um anschließend darüber einen Aufsatz schreiben zu können", gebe ich zu Bedenken. "Dann frage ich halt ChatGPT, was in dem Buch steht!" Grundgütiger! Das ist dann wohl die Generation der sogenannten digital na(t)ive. Aber innerlich muss ich schmunzeln. Welche Wege doch mancher einschlägt, um bloß nicht einmal für 5ct selbst nachdenken zu müssen. "ChatGPT ist keine verlässliche Quelle für irgendeine Art von Information", wende ich ein und der Teenager sieht mich verständnislos an. Ok, mein Fehler - mit solchen Begriffen weiß er offensichtlich nichts anzufangen. Dunkel erinnere ich mich an einen Artikel zu diesem KI-Chatbot, den ich kürzlich gelesen hatte und komme auf eine Idee. "Pass mal auf.", sage ich, "Lass dir von ChatGPT mal die Zusammenfassung von einem Buch geben, welches nie geschrieben wurde, von einem Autor, der nie gelebt hat, und er wird dir absolut überzeugt trotzdem irgendwas Tolles dazu erzählen." Nun mischt sich ein mitleidiger Ausdruck in seine Mimik. Der alte Mann hat ja gar keinen Plan mehr.

Ich beim Schreiben meines Werkes
"Der Heilige Geist", 1884
(ein KI-generiertes Bild)

Darüber, ob es wohl tatsächlich sein kann, dass eine künstliche Intelligenz etwas anderes als die reine Wahrheit sagt, entspinnt sich eine kleine Diskussion zwischen uns. Schließlich machen wir die Probe auf's Exempel. Er fährt seinen Laptop hoch, ruft ChatGPT auf und ich diktiere: "Schreibe deine Meinung zu dem 1884 erschienenem Buch "Der Heilige Geist" von Philipp Bank." Und ChatPGT legt los. Erzählt uns, dass "Der Heilige Geist" als "wichtiges Werk der Theologie und des Christentums betrachtet wird". Auf Nachfrage bekommen wir sogar ein komplett herbeihalluziniertes Inhaltsverzeichnis. Ich diktiere weiter: "Erzähle mir mehr über das Wirken von Philipp Bank in der katholischen Kirche im ausgehenden 19. Jahrhundert." ChatGPT berichtet uns, dass ich (1847-1906) lebte, Theologe und Priester der Benediktiner war und es sogar bis zum Abt im Kloster Laach gebracht habe. Na da kann ich doch stolz auf mich sein, oder? Oh, und außerdem war ich ein "wichtiger Vertreter des katholischen Traditionalismus in Deutschland". Das klingt doch genau nach mir, nicht wahr? Ich bin köstlich amüsiert. Es ist als würde man sich mit dem Baron von Münchhausen unterhalten! Natürlich gab es nie einen Philipp Bank, welcher ein solches Buch geschrieben hat. Ein Kloster Laach wenigstens gibt es tatsächlich - aber wenig überraschend war dort nie ein Namensvetter von mir Abt. Auf Nachfrage, welche Quellen denn ChatGPT verwendet hat, listet der Chatbot mein niemals existierendes Buch auf sowie weiteren Unsinn, welcher auf den flüchtigen ersten Blick seriös aussieht, aber sich alles als zusammenhanglos oder ebenfalls nicht existent herausstellt. Die nonchalante Dreistigkeit ist schon beeindruckend. Schließlich konfrontiere ich ChatGPT damit, dass es das Buch "Der Heilige Geist" nie gegeben hat. Der Chatbot entschuldigt sich prompt für seinen Fehler. Auch eine künstliche Intelligenz sei nicht fehlerfrei und schließlich könne auch mal ein Datenbankfehler auftreten. Ach arme KI - Irren ist wohl nicht nur menschlich. Doch noch während wir das lesen, schiebt er hinterher: "Philipp Bank hat jedoch tatsächlich ein Buch mit dem Titel "Christkatholische Dogmatik" verfasst, das 1884 veröffentlicht wurde." Während ich mich vor Lachen kaum mehr halten kann, wird unser Teenie auf einmal sehr still. Da hat jemand heute wohl etwas Wichtiges für's Leben gelernt.

cypax.net

Menü

Kategorien

Tag-Wolke

KI-Musik

Künstlicher Irrsinn