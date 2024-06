Die Geheimnisse perfekter Prompts – die Vorgeschichte: Vor einigen Monaten las ich einen Artikel, in dem ein sehr erfahrener Prompter eine Behauptung aufstellte: Bevor man mit einem KI-System umgehen könne, müsse man etwa 3.000 Prompts geschrieben haben. Erst ab 10.000 Prompts könne man damit professionell arbeiten. Innerlich stimmte ich ihm zu, denn ich selbst hatte etwa ein gutes Jahr gebraucht, um die ersten 10.000 Prompts zu formulieren. Etwa zu diesem Zeitpunkt bekam ich auch zum ersten Mal das Gefühl, mit einem System – in meinem Fall Midjourney – nun halbwegs professionell arbeiten zu können.

Abkürzung?

10.000 Prompts sind eine ganze Menge. Ich habe mich gefragt, ob das wirklich sein muss. Klar, mit dem fast vergessenen Schulenglisch zu sagen, was man auf dem Bild sehen möchte, fällt vielen (mir auch) anfangs schwer. Auch die übliche Konversation im Urlaub oder am Arbeitsplatz ist meist alles andere als auf präzise Formulierungen ausgelegt. Die Hürde mit der Sprache lässt sich dank ChatGPT oder DeepL relativ leicht nehmen. Nicht aber die Wortfindung für die Bildbeschreibung. Gerade Fotografen, Grafiker und andere Bildkreative sind oft eher Augenmenschen als Formulierungskünstler. Um sie alle schneller mit dem Prompten vertraut zu machen, wäre eine Struktur, die die Formulierungsaufgabe in kleine Häppchen aufteilt, sicher hilfreich. Und vielleicht zusätzlich noch eine Auswahl von so beschriebenen Motiven aus der täglichen Praxis, die man für die eigenen Bedürfnisse weiterentwickeln kann. Dann sollte es möglich sein, von Anfang an mit einem Bildgenerator ergebnisorientiert zu arbeiten und vielleicht schon nach 1.000 Prompts eine professionelle Sicherheit entwickelt zu haben.

Ein Buch: Die Geheimnisse perfekter Prompts

Mit diesen Überlegungen war die Idee für ein neues DOCMA-Projekt geboren. Die nächsten Monate (zum Glück war es ein regnerischer Winter) verbrachte ich damit, eine zuverlässig funktionierende Promptstruktur zu entwickeln, sie zu beschreiben und auf über 140 Praxisaufgaben aus den Bereichen Illustration, Fotografie und Kunst anzuwenden. Dabei kam mir zugute, dass Midjourney in der Version 6 erstmals Hintergrundinformationen veröffentlichte, nach welchen Regeln man Prompts formulieren sollte. Dadurch wurde zwar viel zuvor angesammeltes Erfahrungswissen nutzlos, aber die Konsistenz zwischen Texteingabe und Bildergebnis stieg merklich.

Herausgekommen ist ein über 180 Seiten starkes Buch, das einerseits kurz, prägnant und mit Bildbeispielen die Strukturelemente der Prompts erklärt. Andererseits finden Sie darin Bilder mit Prompts, die Sie direkt für Ihre eigenen Anwendungen nutzen können (per Download) oder durch Modifikation der in der Struktur aufgeschlüsselten Prompts an Ihre eigenen Bedürfnisse anpassen können. Grundsätzlich sind die Beispiele so aufgebaut, dass Sie anhand der Prompts lernen, wie Sie Formulierungsaufgaben KI-gerecht lösen. Dazu reicht es natürlich nicht aus, das Buch nur zu lesen. Es ist auch sehr wichtig, dass Sie selbst mit den Prompts arbeiten. Die Beispiele sind an Midjourney angepasst, aber im Prinzip funktionieren sie (wenn oft nicht so perfekt) auch in anderen Bildgeneratoren wie ChatGPTs Dall•E, Firefly oder Stable Diffusion.

Drei Beispiele

Hier möchte ich einfach mal Beispiele aus den drei Themenbereichen von „Die Geheimnisse perfekter Prompts“ vorstellen, die mit verschiedenen Aspekten der Promptstruktur beschrieben werden können. Denn eines ist bei den strukturierten Prompts ganz wichtig: Es gibt zwar sieben Beschreibungskategorien, aber meistens kommt man mit drei oder vier davon aus. Wichtig ist vor allem, dass man sie als Muster im Kopf hat, wenn man Bilder in Worte fassen will.

Eine Illustration

Hier sehen wir zunächst ein Beispiel für eine Illustrationsaufgabe: Ein Auto, dass es in dieser Ausführung (noch) nicht gibt und das für eine Werbedarstellung an der französischen Mittelmeerküste gezeigt werden soll.

Eine Fotografie

Auch typische Microstock-Motive können in der Beschreibung recht komplex werden. In diesem Beispiel sind fünf der sechs Prompt-Strukturelemente am Werk.

… und ein kubistisches Gemälde

Werke im Stil bekannter Künstler können über einen „Shortlink“ durch Nennung ihres Namens erzeugt werden. Man muss dann nur wissen, wie sie heißen und wie man das schreibt. Es geht aber auch – wie hier – durch Beschreibung eines typischen Bildstils.

„Die Geheimnisse perfekter Prompts“ ist ein neuer Ansatz, Midjourney anhand systematischer visueller Referenzen einfacher zu erlernen und zu verstehen.

