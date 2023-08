Auch wenn die Text-to-image-Systeme absehbar Prompts mit deutschsprachigen Eingaben akzeptieren – noch ist das Englische die Kommunikationssprache, die jeder Promptograf beherrschen sollte. Natürlich tun das die Wenigsten, wenn sie ganz ehrlich sind. Zumindest, sobald es daran geht, Bilddetails sehr präzise zu benennen. Wir hatten das Thema schon vor einigen Wochen, als ich (zusammen mit der Übersetzung von DeepL) der Meinung war, Kornfelder hießen auf US-Englisch „Cornfields“. Ein Trugschluss. Was macht man dann erst mit Begriffen, die einem helfen würden, aber die man gar nicht kennt?

Prompts erarbeiten mit Describe

Grundsätzlich funktioniert eine Prompt-Bildbeschreibung – das ist nicht anders als bei einem Gespräch – am besten, wenn der Gesprächspartner, hier also die KI, die Worte kennt, mit denen das Bild beschrieben wird. Leider wissen wir meist nicht, was die KI wirklich kennt und nehmen einfach an, ihr sind alle englischen Wörter geläufig, die wir und unserer Übersetzungshelfer auch beherrschen. Erfahrungsgemäß ist das zwar so, aber es gibt darüberhinaus noch viele weitere Wörter. Und da man keine Wortliste abrufen kann, hilft ein kleiner Trick, einige dieser hilfreichen Worte zumindest kontextabhängig kennenzulernen. Grundlage ist bei Midjourney die Describe-Funktion, die ich hier kürzlich schon vorgestellt und erklärt hatte. Bei anderen Bild-KIs habe ich solch eine Funktion bisher nicht entdeckt.

Bilder auswerten

Man beginnt mit einem Bild, das man irgendwo gesehen (und fotografiert oder gespeichert) hat, das einem gefällt und lässt es von Midjourney beschreiben. So hatte ich kürzlich bei Fotofestival La Gacilly-Baden 2023 ein Bild von Rudolf Koppitz entdeckt, das mich sehr an spätere Arbeiten von Leni Riefenstahl erinnerte. Nach der Beschreibung des Bildes von Midjourney erhält man vier Prompts.

Schauen wir uns den ersten an und klicken auf die Schaltfläche „1“ zur Berechnung. Midjourney wie hier den irischen Schauspieler Jack MacGowran erkannt haben, wie er auf einer Bergspitze steht. Neben drei Künstlern, die stilistisch als Vorlage gedient haben könnten und direkt zur Wikipedia verlinkt sind, lesen wir einen Hinweis zur Ausführung „exacting precision“ und zur „post-world war ii school of paris“. Bis hierhin hätte man das als Kenner der Fotogeschichte vielleicht auch selbst formulieren können. Aber dann finden sich die Worte „samikshavad“ und „whistlerian“, die zumindest DeepL nicht übersetzen kann. Bei Samikshavad handelt es sich um die erste indigene Kunstbewegung im modernen Indien, Whistlerian leitet sich entweder vom Flüsterer (Whistler) ab oder bezieht sich auf den Maler James Abbott McNeill Whistler (1834–1903). Zweitens passt hier eher.

jack mcgowan, standing on top of a mountain, in the style of georg jensen, norman parkinson, arthur skizhali-weiss, exacting precision, samikshavad, post-world war ii school of paris, whistlerian –ar 107:123

Sie sehen, mal lernt vieles dazu, wenn man Midjourney Bilder als Prompts darstellen lässt. Allerdings ist der Einwand berechtigt, ob es sich hier um Wissen handelt, das weiterhilft. Die zweite Beschreibung ist intellektuell weniger gehaltvoll. Wir lernen hier nur die amerikanische Fotografin Louise Dahl-Wolfe kennen. Außerdem zeigt sich hier wieder einmal Midjourney Schwierigkeit bei der glaubhaften Darstellung von Handfeuerwaffen.

a man standing on top of a mountain with a rifle in one hand, in the style of louise dahl-wolfe, notable sense of movement, working-class empathy, photo –ar 107:123

Das gilt ebenso für die dritte Beschreibung. Der Mann auf dem Ausgangsbild wird von der KI als Frau gelesen. Ansonsten finden sich keine neuen Bezüge.

a woman on top of a mountain with a rifle, in the style of post-world war ii school of paris, theatrical gestures, 1940s–1950s, masculine, photo taken with provia, whistlerian, handsome –ar 107:123

Von den Bildergebnissen her interessanter ist das schon die vierte Beschreibung. Spätestens jetzt muss man kein Kunsthistoriker mehr sein, um an Caspar David Friedrichs „Wanderer über dem Nebelmeer“ zu denken. Erstaunlicherweise erkennt die KI den Zusammenhang nicht.

the man is standing on top of spruce ridge, in the style of postwar avant-garde, film stills, himalayan art, post-world war ii school of paris, photobash, microfilm, traditional poses –ar 107:123

Was lernt man?

Grundsätzlich zeigt unser Bespiel, dass die Describe-Funktion eher neue Ideen erzeugt, als das vorgegebene Bild präzise zu beschreiben und damit zu reproduzieren. Ein Umstand, der vermutlich alle erfreut, die Angst haben, die KI würde ihre Arbeiten 1:1 copyrightfrei nachempfindbar machen. Zudem zeigt sich, wie man damit einem selbst bisher unbekannte Künstler oder Kunstrichtungen entdecken kann.

Wie kann man das nutzen?

In erster Linie um neue Vokabeln zur Bildbeschreibung zu erlernen, unbekannte Künstler oder Kunstschulen für bestimmte Bildrichtungen benennen zu können. Ich habe auf diese Weise, eine Vielzahl beschreibender Begriffe dazugelernt und sammle sie zwischen (samt Übersetzung und Bildbeispiel natürlich) in einer Notizdatenbank.