In der letzten Folge der Prompt Inspiration haben wir uns mit dem Erarbeiten von Prompts mithilfe des Describe-Befehls befasst – und mussten zu dem Ergebnis kommen, dass man zwar viel über Beschreibungen lernen kann, aber dennoch keine allzu ähnlichen Bildergebnisse erhält. Dieses Mal geht es um Optimierungsstrategien.

Prompt Analyse

Ausgangsbild von Rudolf Koppitz (rechts) Midjourney-Ergebnis (links)

Wenn man sich die per Describe-Funktion ermittelten Prompts genauer anschaut wird schnell klar: Sie sind zwar relativ stark bei der Zuweisung von Stilen, lassen aber in Sachen Bildinhalt sehr zu wünschen übrig. Entsprechend kommt man also kaum um die selbstverfasste Inhaltsbeschreibung herum. In unserem Fall handelt es sich um einen breitbeinig stehenden Bergsteiger vor alpiner Kulisse. Das Gerät in seiner Armbeuge ist ein Eispickel. Bemerkenswert für die Bildwirkung ist zudem der tiefe Kamerawinkel.

Eigene inhaltliche Beschreibung

Das Ergebnis geht in die richtige Richtung, zeigt aber durchaus noch Defizite. Der Eispickel ist augenscheinlich ein derart aus der Mode gekommenes Werkzeug, dass Midjourney es nicht kennt. Auch ist der KI der Zusammenhang zwischen alpinen Temperaturen auf verschneiten Berggipfeln und nackter Haut wenig geläufig. Aber vielleicht entblößen die männlichen Bergsteiger, die bis zum Gipfel kommen, für die dort entstehenden Fotos ja mehrheitlich ihre Oberkörper.

wide-legged standing mountaineer with ice axe in the crook of his arm in front of alpine scenery, low camera angle

Ein Vergleichstest mit Bergsteigerinnen lässt diese Beobachtung als typische männliche Geste erscheinen. Hier sieht man also entweder die Prüderie der KI oder ihre Vorurteile.

wide-legged standing female mountaineer with ice axe in the crook of his arm in front of alpine scenery, low camera angle

Also ziehen wir den Mann erst einmal unserer Vorlage entsprechend mit einem weißen Hemd einer schwarzen Hose und Stiefeln an. Auch hier sollte man möglichst präzise formulieren: Also ein weißes Hemd mit Kragen, eine lange schwarze Hose und schwarze Bergstiefel.

wide-legged standing mountaineer with ice axe in the crook of his arm in front of alpine scenery, low camera angle, white collared shirt, long black trousers, black mountain boots

Zeitmaschine

Mit einer Zeitangabe (1940-1950s), wie wir sie von der Describe-Funktion hatten ermitteln lassen, ist schon Einges getan. Die Bergsteiger sehen nun erheblich weniger nach den 2020ern aus. Aber so heldenhaft wie auf dem Ausgangsbild erschienen sie noch nicht.

wide-legged standing mountaineer with ice axe in the crook of his arm in front of alpine scenery, low camera angle, white collared shirt, long black trousers, black mountain boots, 1940-1950s

Stilistische Anleihen

Zitieren wir im Prompt also die stilistischen Anleihen, die Describe ermittelt hat. Das waren vor allem drei Fotografen. Verwendet man sie alle drei als Stilvorgabe, sieht es schon etwas heldenhafter aus.

wide-legged standing mountaineer with ice axe in the crook of his arm in front of alpine scenery, low camera angle, white collared shirt, long black trousers, black mountain boots, 1940-1950s, in the style of georg jensen, norman parkinson, arthur skizhali-weiss

Zitiert man nur einen der Fotografen als Stilvorlage im Prompt wird es noch besser und vor allem weniger bunt.

wide-legged standing mountaineer with ice axe in the crook of his arm in front of alpine scenery, low camera angle, white collared shirt, long black trousers, black mountain boots, 1940-1950s, in the style of arthur skizhali-weiss

Reformierung

Weil mich das Ausgangsbild sehr klar an Leni Riefenstahls Heldenbilder der 30er Jahre erinnerte, habe ich den Prompt noch etwas spezifischer in diese Richtung formuliert. Allerdings bleibet dann nichts mehr von dem erhalten, was die Describe-Funktion ermittelt hat.

heroic very wide-legged standing mountaineer with ice axe in the crook of his arm in front of alpine scenery, low camera angle, white collared shirt, long black trousers, black mountain boots, 1930s, by Leni Riefenstahl

Fazit

Die besten Ergebnisse kommen heraus, wenn man selbst genau sagen kann, was man auf dem Bild sehen will. Midjourney eine Bildbeschreibung errechnen zu lassen, ist bestenfalls ein guter Startpunkt.