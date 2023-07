Generative KI eigene sich vorwiegend für Bilder, die man auf konventionellem Weg nur aufwendig oder gar nicht umsetzen kann. In dieser Folge geht es um das Thema Miniaturisierung, also die künstliche visuelle Verkleinerung von Objekten, Tieren oder auch Menschen.

Eine Frage der Verhältnismäßigkeit

Wie groß oder klein ein Motiv ist, erschließt sich nur im Vergleich zu Referenzobjekten. Idealerweise wählt man hier Dinge, die eine fixe, allen Betrachtern bekannte Größe besitzen. Oft tut es etwa ein Geldstück. Am Bestzen eins, das alle vermeintlichen Betrachter einschätzen können. In Europa wäre das zum Beispiel eine Euromünze.

photography of a mouse sitting next to an one euro coin

Im Prinzip funktioniert das mit Midjourney, nicht wirklich perfekt, aber man kann damit arbeiten.

Miniaturisierung – einfache Ideen

Ein Elefant soll auf einer Fingerspitze stehen. Das geht relativ einfach, ist aber auch ziemlich langweilig.

elephant standing on a fingertip

Versuchen wir es mal mit einer beschreibenden Geschichte zu unserer Miniaturisierung: Ein Elefant steht auf der Fingerspitze eines Kindes in dessen Spielzimmer. Da wird unser Elefant in jedem Fall erheblich miniaturisiert, aber von der Fingerspitze ist nichts mehr zu erkennen.

an elephant stands on the fingertip of a child in his playroom

Hier ist wohl mehr sprachliche Klarheit nötig. Also geben wir die Art der Fotografie vor und trenne das Thema vom Hintergrund. Das funktionier relativ gut, einmal abgesehen davon, dass der Elefant auf der Hand und nicht auf der Fingerspitze steht und die Hand noch ein wenig ungewöhnlich geformt ist.

marco photography, of a childrens fingertip with an elephant on it, a playroom in the background

Zwei Bildkonzepte kombinieren

Bei der Arbeit mit generativer KI sollte man immer im Hinterkopf haben: Sie arbeitet am besten, wenn man mit für die KI klaren Konzepte arbeitet. Nehmen wir die Konzepte „Hochhaus“ und „Nussschale“ und versuchen sie zu verbinden. Aus strategischen Gründen, testen wir, was passiert, wenn wir die Worte zunächst einzeln eingeben.

Skyscraper

Nutshell

Beim „Skyscraper“, wie man Hochhäuser gemeinhin auf Englisch bezeichnet, nimmt die KI das Wort wörtlich und lässt das Hochhaus durch die Wolken sprießen und am Himmel kratzen. Irritierender sind die Ergebnisse der Nussschale: Hier kommen unterschiedliche Bedeutungen ins Spiel, zum Beispiel, dass man Schiffe auch als Nussschalen bezeichnet. In jedem Fall zeigt keins der Bilder, die Schale einer Nuss. Das sollte man also genauer formulieren. Allerdings kommen dabei eher Fanatasie-Nüsse als das heraus, was zumindest ich mit meinem beschräkten Horizont mir unter einer Nuss vorstelle.

the shell of a nut

Wie so oft hilft die Konkretisierung, in diesem Fall also die Angabe, um welche Art von Nuss es gehen soll.

shell of a coconut

Damit das Hochhaus zur Kokosnuss passt, sollten wir hier vielleicht auch etwas genauer werden. Die meisten Kokosnüsse kommen aus Indonesien, also soll es ein asiatisches, natürlich vollökologisches Hochhaus werden.

Indonesian skyscraper in the style of an ecological future

Kombiniert man die beiden, nur relativ klaren Konzepte, kommt nicht das heraus, was intendiert war, also keine Miniaturisierung, sondern die Kokosnuss bestimmt eher die Form des Hochhauses.

Indonesian skyscraper in the style of an ecological future, buld on a coconut shell

Zeit also für sprachliche KI-Kunstgriffe: Zunächst definieren wir die Bildart als Kunst-Fotomontage und rücken die Kokosnuss sprachlich in den Vordergrund.

art photomontage, from the shell of a coconut grows an ecological skyscraper

Mit der Definition auf eine Makro-Fotografie und der Positionierung in er Wohnumgebung kommt das Ergebnis langsam auf die Zielgrade der ursprünglichen Idee.

macro art photomontage, from the shell of a coconut grows an ecological skyscraper, in the background is a kitchen

Die Festlegung auf ein Tilt-Shift-Objektiv mach den nicht wirklich sichtbar umgesetzten Wohnraumhintergrund überflüssig. Dafür ist jetzt eine ganze miniarturisierte Stadt in der Kokosnussschale.

macro tilt-shift photography, from the shell of a coconut grows an ecological skyscraper

Das lässt sich relativ einfach lösen, indem man die Anforderungsbeschreibung auf einen einzigen Wolkenkratzer beschränkt.

macro tilt-shift photography, from the shell of a coconut grows a single ecological skyscraper

Nur kratzt der jetzt nicht mehr so richtig an den Wolken, sondern ist eher ein mehrstöckiges Gebäude.

Menschenklein

Auch Personen lassen sich wie in Filmen oder der – dieser Idee oft zugrunde liegenden – Literaturvorlage Gullivers Reisen von John Swift (1726) schrumpfen. Besonders bleibt – und nach heutiger Lesart sehr frauenfeindlich – war dieses Sujet bei den frühen Fotomonteuren der 30er-Jahre aus dem Atelier Manassé, das Dependancen in Wien und Berlin besaß.

macro photomontage, mini female influencer bathes in a giant wineglas on a bar counter next to a pool –ar 3:2

Fazit

Hier zeigt sich mal wieder deutlich das (noch) fehlende Weltwissen der KI. Für uns als Betrachter ist klar: Die Frau sitzt entweder ganz im Glas oder davor. Oder das Glas ist an einer Übergangsstelle geborsten. Die KI hat hier augenscheinlich zu wenig Trainingsmaterial bekommen, um diese Zusammenhänge zu berücksichtigen.