Das wäre KI nicht passiert
Die Ausgabe des „Spiegel“ zeigt in dieser Woche fünf europäische Politikerinnen und Politiker, die in mittelalterlicher Gewandung Grönland gegen einen drohenden Angreifer verteidigen wollen. Schöne Idee. Schlimm nur, dass die für die Montage Verantwortlichen noch immer nicht gelernt haben, dass bei einer solchen Zusammenstellung einheitliche Beleuchtungsbedingungen herrschen müssen.

In der aktuellen DOCMA-Ausgabe berichte ich über einen Auftrag, bei dem ich vor einigen Jahrzehnten vier unterschiedlich beleuchtete Porträtfotos zu einer Montage zusammenfügen musste, in der sie die Köpfe der US-Präsidenten am Mount Rushmore ersetzen sollten. Nein, hier geht es nicht darum, dass es eine Initative gibt, der Gruppe bald einen fünften hinzuzufügen. Man muss nicht lange raten, wer das wohl sein soll … „Zusammenfügen musste“ deswegen, weil es eine höllische Arbeit war, diese vier Gesichter in Photoshop so zu bearbeiten, dass sie den Beleuchtungsbedingungen des Bergdenkmals als Hintergrundebene entsprachen.
Denn weil alle vier unabhängig voneinander aufgenommen worden waren, mal frontal beleuchtet, mal von der einen, dann von der anderen Seite, mal mit hartem und mal mit weichem Licht, dauerte es Tage, das zu vereinheitlichen. Beleuchtete Stellen mussten aufgehellt werden, Körperschatten angepasst, Schlagschatten entfernt und neu konstruiert werden.
Als ich das Werk ablieferte und auf diese Probleme hinwies, war die schlichte Antwort: „Ach, das hätte doch niemand gesehen.“ Und genau dieselbe Reaktion bekam ich, als ich nun jemandem entsetzt das neue Spiegel-Cover zeigte. „Siehst du da was Auffälliges?“ Längeres Nachdenken. „Nein“. Und nach der Aufklärung darüber, dass hier jedes Gesicht anders beleuchtet ist, folgte das vertraute „Das sieht doch niemand – außer dir.“ Ist das so?
Wie es der Zufall will, standen die „Spiegel“-Grafiker in der vergangenen Woche – und Jahrzehnte später – also vor derselben Aufgabe wie ich damals, nur waren es diesmal fünf Köpfe statt vier. Doch mit dem erheblichen Unterschied, dass ich nur je ein Porträtfoto hatte, während man heute auf Tausende von Merz & Co zurückgreifen und sicherlich mühelos Exemplare finden könnte, die vergleichbare Beleuchtungsbedingungen aufweisen.
Doch nehmen wir mal den unwahrscheinlichen Fall an, sie hätten wirklich nur diese fünf Aufnahmen zur Verfügung gehabt. Dann hätten sie sich eben hinsetzen müssen und das machen, was ich damals getan habe. Immerhin ging es seinerzeit nur um ein Poster, das anlässlich eines Jubiläums in einer kleinen Firma hängen sollte – dieses Titelblatt aber sehen Hundertausende.
Aber, wie gesagt, seitdem sind Jahrzehnte vergangen, und auch, wenn es sich vielleicht noch nicht überall herumgesprochen haben sollte – DOCMA lesen lohnt sich! –, gibt es inzwischen generative künstliche Intelligenz, mit der man Bilder herstellen oder vorhandene abändern kann.
Ja, auch KI macht noch Fehler (darauf werde ich in einem Beitrag in der nächsten DOCMA-Ausgabe 117 ausführlich eingehen). Aber inkonsistente Beleuchtungsbedingungen kommen nahezu nie vor. Nun hätte man nicht die komplette Montage einer KI überlassen müssen. Es hätte ausgereicht, einen der Köpfe als Referenz zu nehmen (der, der am besten zu Kleidung und Hintergrund passt) und einer KI per Prompt zu sagen, sie solle nacheinander die anderen Köpfe mit derselben Beleuchtungscharakteristik darstellen.
Allerdings gibt es hier zugegebenermaßen deutliche Einschränkungen: Von den KIs, mit denen ich arbeite, war nur eine einzige in der Lage, dieses Problem zu lösen: Nano Banana. Und das auch bei weitem nicht immer. Alle anderen ändern gar nichts oder missverstehen den Prompt gründlich.

Ich habe es hier mal am Beispiel Macron ausprobiert und eine ungewöhnliche Beleuchtung von schräg unten erhalten. Die Ähnlichkeit hat ein wenig gelitten; hätte ich „Macon“ in den Prompt aufgenommen, hätte die KI allerdings die Bearbeitung ganz verweigert. Und egal, wie der Prompt umformuliert wurde – auch mit intensiver Konsultation von ChatGPT: Meist wurde das Porträt nur um 90 Grad gedreht ohne weitergehende Änderungen. (Nebeneffekt: Es wurde dabei entrastert, ist ja auch schon mal was.)

Fazit also: Manche KI ist durchaus dazu in der Lage, einen solchen Prompt umzusetzen, tut das in der Praxis aber nur ausnahmsweise. Seedream etwa folgte brav der Anforderung der Beleuchtungsveränderung, ignorierte aber die Prompt-Bestandteile, die verlangten, Ausrichtung und Gesichtszüge unverändert zu belassen. Man wird also noch eine Weile warten müssen, bis die Modelle in der Lage sind, mehr 3D-Informationen zu berücksichtigen.

Doch unabhängig davon – solange KI das nicht kann, muss man eben manuell mit Photoshop ran. Eine solche zusammengestoppelte Montage wie diese jedenfalls lässt man nur Anfängern durchgehen und erwartet sie nicht auf einem „Spiegel“-Cover.











„Das sieht doch niemand – außer dir.“
Das liegt zu einem guten Teil daran, dass solche Ausleuchtungendivergenzen beinahe die Regel sind. Betrachter sind sie gewohnt.
Sieht man Covers von DVDs oder auch Ankündigungen von Serien und Filmen im TV und Zeitschriften, meist online,, so werden dort sehr häufig handelnde Schauspieler montiert in einer Gruppe gezeigt. Eher selten wird am Set eine reale Gruppenaufnahme erstellt. Diese montierten Gruppendarstellungen haben zwar nicht so krasse Ausleuchtungsfehler, doch sind sie sehr einfach als Montage erkennbar.
Wenn man schaut.
Nach meinen Informationen beträgt die durschschnittliche Betrachtungsdauer eines Gemäldes bei einem Museumsbesuch unter 30 s, die durchschnittliche Betrachtungsdauer eines Fotos in einer Zeitung maximal 5 s. Diese wenigen Sekunden reichen gerade mal zum Erkennen der Personen und dem Auslösen der individuellen Emotion, die jedes Bild verursacht.
Wenn Sie und ich und hoffentlich möglichst viele andere noch Ausleuchtungsfehler erkennen und bei Montagen vermeiden bleibt es ein Minderheitenprogramm. Man kann nur hoffen, dass die Mehrheit beim Vergleich von korrekt und faktisch falsch ausgleuchteten Bildern bei letzteren ein unbehagliches Gefühl verspüren. Dass Auftraggeber die Mehrkosten einer glaubwürdigen Bearbeitung aufbringen bleibt ein unerfüllbarer Wunsch.
Von einer schlecht gemachten Montage geht die Welt nicht unter, aber hier geht es um ein Erlebnis, wie es jeder Handwerker kennt, der auf das stümperhafte Werk eines Kollegen stößt: Es ist eine Schande für den Berufsstand.