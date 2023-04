Da verwendet man sein Leben lang ein Wort, von dem man sicher zu wissen meint, was es bedeutet, und dann bricht plötzlich ein Streit darüber aus: Was ist ein Foto?

Offensichtlich ist das keine Luftaufnahme von Köln, aber so stellt es sich Stable Diffusion vor.

Vor anderthalb Wochen hatte Boris Eldagsen für einen Eklat bei der Verleihung der Sony World Photography Awards in London gesorgt. Zur Überraschung der Veranstalter lehnte er die Annahme seines Preises ab, da das ausgezeichnete Werk („PSEUDOMNESIA | The Electrician“) gar kein Foto war. Er hatte es mit einer generativen KI produziert, und da es um einen Fotowettbewerb ging, erschien es Eldagsen falsch, den Preis zu akzeptieren. Dass er das Bild überhaupt eingereicht hatte, dahinter steckte ein Hintergedanke, den er in einer Nicht-Annahme-Rede begründete: „KI-Bilder und Fotografie sollten bei einem Preis wie diesem nicht miteinander konkurrieren. Es handelt sich um unterschiedliche Dinge. KI ist keine Fotografie. Deshalb werde ich den Preis nicht annehmen. Ich habe mich als Schelm (cheeky monkey) beworben, um herauszufinden, ob die Wettbewerbe auf die Einreichung von KI-Bildern vorbereitet sind. Sie sind es nicht.“ Die Regeln des Wettbewerbs erlaubten schließlich „any device“ für die Herstellung der eingereichten Bilder; von einer Kamera stand da nichts, obwohl die Veranstalter zumindest im Nachhinein darauf insistierten, dass nur Fotografien akzeptabel gewesen wären. Aber was ist denn dann ein Foto?

Stable Diffusions Version von Berlin

Dass die digitale Fotografie mit gleichem Recht Fotos produziert wie die analoge Silberhalogenidfotografie oder andere chemische Verfahren, das wird längst akzeptiert. Aber muss beispielsweise eine Linse (oder vielleicht noch ein Hohlspiegel) im Spiel sein? Was ist mit Lochkameras und welchen Status haben Fotogramme? Sind Röntgenbilder Fotografien?

Fotografieren bedeutet „Zeichnen mit Licht“; so viel ist klar. Ein fotografisches Bild entsteht durch Licht, das vom abzubildenden Motiv reflektiert wird oder es durchleuchtet. Dies setzt voraus, dass alles Licht, das von einem Punkt des Motivs ausgeht, am Ende auf einen Punkt (oder wenigstens eine sehr kleine Fläche) einer lichtempfindlichen Substanz fällt, wo es einen dauerhaften physikalisch-chemischen Effekt auslöst. Verteilt sich das Licht auf eine größere Fläche, vermischt sich alles und es entsteht kein erkennbares Abbild. Dies wird meist durch eine Optik gewährleistet, deren einfachste Variante die Öffnung einer Lockkamera ist: Je kleiner das Loch, desto kleiner ist die Fläche, die von einem Punkt des Motivs beleuchtet wird. Eine größere Lichtstärke erreicht man allerdings mit Linsen oder Hohlspiegeln, die durch eine größere Öffnung fallende Lichtstrahlen bündeln.

Wenn das Licht selbst bereits gerichtet ist und/oder sich das Motiv und die lichtempfindliche Fläche sehr nahe sind, funktioniert die fotografische Abbildung selbst ohne jede Optik – das wäre dann ein Fotogramm, für das man sein Motiv direkt auf ein Fotopapier legt und dem Licht aussetzt.

Einen Frankfurter wird dieses Bild seiner Stadt nicht überzeugen.

Schaut man sich solche Fotografien genauer und in einer immer stärkeren Vergrößerung an, wird man unweigerlich Artefakte finden. In der Silberhalogenidfotografie entstehen diese durch die Form von Silberkristallen oder (in der Farbfotografie) von Farbstoffwölkchen in der Filmemulsion. Dabei kennt der schwarzweiße Negativfilm genau genommen nur Schwarz (undurchsichtige Silberkristalle) und Weiß (die transparente Filmbasis), und der Farbfilm nur die Grundfarben; aus der Nähe verschwinden die Zwischentöne. CMOS-Sensoren erzeugen Bilder aus meist quadratischen Pixeln, wobei jedes Pixel nur für eine Grundfarbe empfindlich ist und die fehlenden beiden Farbkomponenten aus den Nachbarpixeln rekonstruiert werden müssen. Ab einem bestimmten Betrachtungsmaßstab sieht man so oder so nur noch Artefakte statt echter Motivdetails, und wir müssen akzeptieren, dass ein Foto, das man aus zu großer Nähe betrachtet, am Ende kein Bild mehr ist und folglich auch kein Foto. Sorgen wir uns also nicht um die kleinsten Details, denn sie sind nicht das, was ein Foto ausmacht.

Im Kern verstehen wir unter Fotografie eine Abbildung in dem für unsere Augen sichtbaren Licht. Aufnahmen im nahen Infrarot oder mit UV-Licht sind klassischen Fotos ähnlich genug, dass wir sie ebenfalls meist noch als Fotos akzeptieren. Bei Wärmebildern im fernen Infrarot oder bei Röntgenbildern zögern wir bereits, aber wir brauchen uns nicht strikt auf einen bestimmten Wellenlängenbereich festzulegen. Es gibt eine Fotografie im engeren Sinne, die das sichtbare Licht nutzt, und wenn man den Begriff in einem weiteren Sinn benutzen will, muss man das klar sagen.

Auch von Dresden hat Stable Diffusion ein ungefähres Bild.

Von einer generativen KI erzeugte Bilder sind also keine Fotografien, denn weder sind Licht oder andere elektromagnetische Wellen im Spiel, noch gibt es überhaupt ein Motiv. Dasselbe gilt für die aus einem 3D-Modell gerenderten Bilder. Montagen sind keine Fotografien, auch wenn es ihre Teile sein mögen; ihnen liegt kein einzelnes Motiv zugrunde und sie sind nicht in einer einzigen Belichtung entstanden.

Eine KI, die beim Demosaicing der Sensordaten hilft, wie es die »Verbessern«-Funktionen in Lightroom und ACR tun, ist einem Foto dagegen nicht abträglich. Diese KI-Unterstützung betrifft schließlich nur die Details, um die es für die Eigenschaft, ein Foto zu sein, ohnehin nicht geht. Wie ich oben schon schrieb: Ein Foto kann noch so scharf und fein aufgelöst sein – bei irgendeinem Vergrößerungsfaktor werden sich Artefakte zeigen.