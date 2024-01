KI kann nicht nur Bilder erzeugen, die wie Fotos, Gemälde oder Grafiken aussehen. Einige Systeme erlauben es auch, eigene Bilder hochzuladen, an deren Stil sich neu generierte orientieren. Noch spannender ist die Funktion etwa von Deep Dream Generator, solche Referenzbilder auch als Motivvorlagen für Bildvariationen per KI zu verwenden. Damit lassen sich nicht nur Details hinzufügen, sondern auch mangelhafte Bilder in brauchbare verwandeln. Doc Baumann hat ausprobiert, wo (derzeit) die Grenzen dieses Verfahrens liegen.

Es begann damit, dass mich Kaloyan von Deep Dream Generator in einer Mail darauf hinwies, dass diese KI nicht nur Bilder erzeugen, sondern auch über die Funktion „evolve“ modifizieren kann. Die Ergebnisse waren so beeindruckend, dass ich seitdem auch mit anderen Systemen generierte Bilder probeweise oft durch diesen Prozess laufen lasse. Deep Dream Generator lässt das für fast alle seiner Modelle – mit Ausnahme von AIVision – zu; ergänzend kann man in 10%-Sprüngen die Ähnlichkeit mit dem Ausgangsbild definieren – 10% „Effect strength“ ist sehr ähnlich, 90% eine recht freie Interpretation. Ergänzend wird immer ein Prompt benötigt, der in solchen Fällen natürlich am besten aus dem Ausgangsprompt des KI-generierten Bildes besteht, bei Fotos aus deren möglichst exakter Beschreibung (in Englisch).

Wie Sie im Folgenden sehen werden, habe ich für die Bildvariationen mit KI verschiedene Ausgangsbilder verwendet:

Ein bereits per KI (NightCafe/Stable DiffusionXL)erzeugtes Bild, das in Deep Dream Generator mit dem Modell „Photonic“ bei 60% neu berechnet wurde. Zum Vergleich sehen Sie darunter eine mit Magnific.ai erstellte Version, das mein Kollege Olaf Giermann hier kürzlich vorgestellt hatte. Die Qualität ist nicht wesentlich besser, aber Magnific ist deutlich teurer. Ausgangsbild ist ein normales Foto eines kleinen Mädchens. Ich habe das Bild genau beschrieben und den Text dann als Prompt für die Bildvariationen verwendet. Je höher der Wert für „Effect strength“, um so eigenwilliger die Umsetzung. Was passiert aber, wenn man ein qualitativ sehr schlechtes Ausgangsbild hat? Das habe ich ausprobiert, indem ich das Foto durch ein paar Photoshop-Filter laufen ließ, so dass kaum noch erkennbare Details übrig blieben, dafür aber viele Artefakte entstanden. Bereits 40% Effekt strength führten zu brauchbaren Ergebnissen. Bei 90% unterscheidet sich das Resultat dann allerdings nur noch wenig von einer rein prompt-basierten Eingabe ohne Referenzbild. Ähnlich bin ich mit dem Foto eines Leuchtturms vorgegangen. Die Bildvariationen mit 60 und 90% führten zu sehr viel „schöneren“ Ergebnissen, hatten aber mit der Originalszene nur noch wenig zu tun. Erwartungsgemäß waren auch die rein prompt-basierten Bilder eindrucksvoll. Auch das Leuchtturm-Foto verschlechterte ich, diesmal, indem ich den Gaußschen Weichzeichner mit einer Stärke von 15 Pixeln anwandte. Noch bei 40% weist das Ergebnis Unschärfe auf; bei 60% ist es scharf – entsprechend frei interpretiert ist das Motiv. Was würde bei einem Foto entstehen, bei dem ich auf dem Kameradisplay nicht gesehen hatte, dass sich Regentropfen auf dem Objektiv niedergeschlagen hatten? Erst bei 40% – sowohl bei Deep Dream Generators Modellen Photonic als auch PhotoMage, verschwanden diese Tropfen, aber da sah das fotografierte Aquädukt auch schon ganz anders aus. Höhere Werte führten zu einer noch phantasievolleren Architektur. Schließlich wollte ich es ganz genau wissen und begann diesmal mit der groben Skizze eines Hundes auf einer Wiese, im Hintergrund Bäume, Berge und Himmel. Bei einer Schwarzweiß-Version der Grafik bedurfte es sehr hoher Werte mit entsprechend eigenwilligen Variationen. Besser wurde es bei einer farbigen Vorlage, aber noch bei 80% wirkte die Wiese sehr künstlich (vom fünften Bein mal ganz abgesehen). 90% führten schließlich zu einem sehr guten Resultat, das sich noch immer am Referenzbild orientierte – ohne dieses, nur mit Prompt, war die Ausrichtung des Hundes eine andere. Perfekt ist das noch nicht, Details wie Schlagschatten oder Schwanz sind – noch – nicht überzeugend.

Bild 1 | Prompt: »a painting in the style of the photorealists like richard estes, a street scene in New York, looking along the street, at a sunny day with reflections of the modern houses in a modern shop window pane, empty street, a few cars, no people, realistic and detailed painting«) / NightCafe Creator/Stable DiffusionXL – bearbeitet mit Deep Dream Generator/Photonic/60% – bearbeitet mit Magnific.ai

Bild 2 | Prompt: »professional photo, a little girl, 3 years old, seen from behind, wearing a gray cap, yellow windbreaker, black pants, red shoes, the girl is standing on a metal grid, she is holding on to a vertical metal bar, at the top and behind A yellow telescope with two tubes is attached to her, behind the girl and the telescope there is a strip of gravel on the ground, above it a raw hpozontal wooden beam, in the background the pale green sea with a high horizon«. / original – evole: Photonic 50, 60, 80%

Bild 3 | Selber Prompt, vergröbertes Original – evolve Photonic 40, 40, 60, 90% – nur Prompt ohne Referenzbild

Bild 4 | Prompt: »professional photo, a lighthouse with white and red horizontal stripes, dunes with some plants in the foreground, two small houses with red roofs in the dunes, blue sky with a few weak clouds« / Original – evolve Photoc 40, 60, 90% – nur Prompt ohne Referenzbild mit KI-Modell Photonic – mit KI-Modell AIVision

Bild 5 | selber Prompt, mit Gaußschem Weichzeichner mit 15 Pixel Radius gesoftetes Foto – evolve Photonic 20, 40, 60%

Bild 6 | « Prompt: »professional and detailed photo: a roman aqueduct in winter with a thin layer of snow, some bare trees, ruins in the foreground, dark weather« / Original – evolve Photonic 40% – evolve PhotoMage 40%

Bild 7 | Prompt: »a professional photo of a brown dog on a wide meadow, trees in the background,

far away high mountains, blue sky with some clouds« / Original – evolve Photonic 80, 90% – nur Prompt ohne Referenzbild

Das Verfahren, in Deep Dream Generator Bildvariationen mit KI zu erzeugen, steht sicherlich erst am Anfang und bedarf weiterer Entwicklung. Aber schon jetzt kommen dabei ansehnliche Ergebnisse mit beeindruckendem Detailreichtum heraus, für die man bei einer „manuellen“ Montage sehr viel Arbeit aufwenden müsste. Wir dürfen auf die Zukunft dieser Funktion sehr gespannt sein.