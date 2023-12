Es kommt eher selten vor, dass viele Zuhörerinnen und Zuhörer eines Vortrags traurig und resigniert nach Hause gehen, obwohl sie eine Menge dazugelernt haben und den Inhalt interessant und hilfreich fanden. Diese Erfahrung musste Doc Baumann vor ein paar Tagen nach seiner Gastvorlesung an der Kunsthochschule HAWK in Hildesheim machen, in der er nicht nur über kunstwissenschaftliche Aspekte von bild-generativer KI sprach, sondern auch über die Berufsperspektiven, die sich in diesem Zusammenhang abzeichnen.

Alle Bilder wurden per KI mit dem folgenden Prompt erzeugt: »Professionelles detailliertes Foto: ein 25-jähriger Bettler, trauriger Gesichtsausdruck, zerrissene Kleidung, ein Becher vor sich, ein Roboter wirft eine Münze in diese Tasse, ein alter Laptop neben dem Bettler, der Bettler lehnt an einer Hauswand in einer modernen, geschäftigen deutschen Fußgängerzone mit vielen Geschäften und Passanten, Regen« Dabei schaffte es keine KI, zum Beispiel den spendenfreudigen Roboter im Bild erscheinen zu lassen. Dieses Bild wurde mit NightCafe/Stable Diffusion XL generiert, der Roboter per Inpainting in Photoshop eingefügt. Hoffen wir, dass die derzeit ausgebildeten Fotografen und Gestalter nicht so enden …

Diese neue Technik wird uns noch alle arbeitslos machen – und das, obwohl die damit geschaffenen Bilder leer und seelenlos sind und viele Mängel aufweisen. Wenn wir es nicht schaffen, das zu verhindern, stehen wir bald arbeitslos auf der Straße, und die paar Leute, die genug Geld haben, sich das nötige Equipment für die Beherrschung dieser neuen Technik leisten zu können, werden sich eine goldene Nase verdienen. Und das alles nur, weil unsere bisherigen Auftraggeber und Kunden nicht in der Lage sind, die ästhetischen Unterschiede zwischen diesem maschinell produzierten Bilderschrott und unseren Werken angemessen zu würdigen, hinter denen eine lange Ausbildung und jahrelange Erfahrung stecken!

Originalton 2023? Nein – eigentlich die knappe Zusammenfassung dessen, was man Mitte des 19. Jahrhunderts lesen konnte, als die Fotografen begannen, den Malern und Zeichnern die Aufträge wegzunehmen.

Ob es nun die späte Rache und List der Geschichte ist, dass die damaligen Neuerer nun selbst davon bedroht sind, von der nächsten Welle bilderzeugender Technik davongespült zu werden, kann man sich zwar fragen – sehr viel weiterführen wird das aber nicht.

Zwei Versionen bei identischem Prompt mit Adobe Fiefly

In der nächsten DOCMA-Ausgabe 109 werden Sie einen Artikel von mir finden, der sich ausführlicher damit befassen wird, ob KI eher ein Jobkiller für Fotografen und Gestalter sein wird oder ein Werkzeug – anthropomorphisierender ausgedrückt: gar ein Partner.

Hier möchte ich nur kurz die Hoffnungen und Befürchtungen zusammenfassen, die nach meinem Vortrag in den Wortmeldungen zum Ausdruck kamen. Wie die Zukunft aussehen wird, weiß ich natürlich genauso wenig wie alle anderen. Aber ich kenne die Gewohnheit, Gegenwärtiges einfach linear in die Zukunft zu projizieren und daraus Prognosen abzuleiten. Das kam zum Beispiel in dem Kommentar zum Ausdruck, wie wichtig es sei, sich intensiv mit den Hintergründen der Promptstrukturen der verschiedenen KI-Systeme zu befassen, das sei die Zukunft.

Ich werde hier gewiss keine Wetten anbieten – aber nach meiner Einschätzung hat sich dieser Ansatz zu dem Zeitpunkt, an die diese Studenten voraussichtlich ihren Abschluss machen werden, längst erledigt. Noch vor ein, zwei Jahren war nicht absehbar, welche Qualitäten KI-generierte Bilder heute haben würden. Oh ja, zu viele Finger, verzerrte Gesichter, merkwürdig verrenkte Gliedmaßen, zerstückelte Schrift und vieles mehr! Klar, gibt es heute vereinzelt immer noch, aber eher als Ausnahme.

Mit identischem Prompt und Deep Dream Generator / PhotoMage

Ankündigungen der letzten Wochen – Neuro-Chips auf analoger Basis, die 10.000 mal schneller sein sollen als die derzeit verbauten, ein geheimnisvolles Projekt Q, das eine neue Stufe der KI einleiten soll usw. – lassen vermuten, dass auch dies Entwicklung nicht linear, sondern exponentiell sein wird. KI-Training mit den neuen Chips würde nicht mehr Monate benötigen, sondern Minuten. (Jedenfalls im Prinzip: Ein Jahr hat knapp 32 Millionen Sekunden, ein Zehntausendstel davon ist nicht einmal eine Stunde.) Und KI kann ja nicht nur, unter anderem, Bilder und Texte generieren, sondern auch Programmcodes schreiben. Und zwar zum Beispiel für die nächste KI-Generation, die noch mehr noch besser kann (unter anderem programmieren).

Klar, wohin die Reise geht? Sich auf den aktuellen Einschränkungen und Mängeln etwa von ChatGPT, Firefly, Midjourney, Stable Diffusion oder anderen auszuruhen, wäre recht kurzsichtig. Um bei den Bildern zu bleiben: Vieles spricht dafür, dass in absehbarer Zeit keine ausgefeilten Prompts mehr nötig sein werden, um das gewünschte Ergebnis zu erzielen. Eher interaktiv – und mit sehr viel Stromverbrauch – mit lockeren Anweisungen wie: ein paar mehr Wolken am Himmel, vor allem oben rechts, das Auto weiter nach hinten, etwas länger und schwarz statt blau, und das Lächeln der Frau könnte noch etwas ausgeprägter sein. (Je nach Weiterentwicklung der KI mit einem „bitte“ ergänzt oder nicht.)

Mit identischem Prompt und NightCafe / Stable Diffusion – im oberen Bild taucht immerhin mal ein Roboterchen auf, auch wenn er nichts spendet

Natürlich und nachvollziehbarerweise hört man so was nicht gern, wenn man gerade in einem Studium steckt, das in eine Berufstätigkeit als Fotograf oder Grafikerin münden soll. Da glaubt man dann gern, klar, das sei wohl eine kaum abwendbare Entwicklung – aber mal ehrlich: Ich denke, meine Sachen sind so gut, die wird eine KI sicherlich nie ersetzen können.

1986 habe ich das erste Buch in Deutschland gemacht, das mit DTP am Computer gesetzt und gestaltet wurde – mein Begleitband zu dem Film „Der Name der Rose“. Dieses neue Verfahren fand schnell die Aufmerksamkeit der Fachwelt und ich wurde vom Börsenverein des deutschen Buchhandelns zu einer Tagung der Verlagshersteller für einen Vortrag darüber eingeladen, wie ich das gemacht hatte. Diese Leute sind für die Gestaltung und Produktion der Bücher zuständig, und ich trat dort zu einem Zeitpunkt auf, als viele Druckereien gerade ihre tonnenschweren Vorräte an Bleibuchstaben verschrottet und für viel Geld funkelnagelneue Lichtsatzmaschinen angeschafft und Qualifizierungskurse gebucht hatten.

Und dann komme ich mit meinem kleinen Macintosh unterm Arm, mit ein paar Fonts auf einer einzigen 400-KB-Diskette, und erkläre den versammelten Herrn (eine Dame war nach meiner Erinnerung nicht dabei), dieser schuhkartongroße Kasten könne – fast – all das auch, was ihre Anlagen leisten. Am Ende des Vortrags gab es höflichen Beifall, der Vorsitzende kam nach vorn, legte mir jovial die Hand auf die Schulter und erklärte, das sei ja alles ganz interessant – aber ich solle doch bitte nicht glauben, damit werde man jeweils ein richtig hochwertiges Buch oder eine Zeitschrift setzen können, sauber mit Blocksatz und so. Vielleicht könne der Edeka-Kaufmann an der Ecke damit in ein paar Jahren seine Sonderangebotszettel machen, aber eine andere Perspektive sehe er da nicht.

Ich grinste nur – ich hoffe, nicht zu unverschämt –, und sagte bescheiden: „Schau’n wir mal, wer zuletzt lacht …“

Heute weiß kaum noch jemand, was DTP (Deskop Publishing) überhaupt ist – nicht, weil es längst vergessen wäre, sondern weil es gar nichts anderes mehr gibt. Lichtsatz? Nie gehört! Es dauerte nicht so sonderlich lange, bis ich zuletzt lachen konnte. Dabei verlief die Entwicklung vergleichsweise gemächlich, gemessen an den heutigen Möglichkeiten der KI. Vielleicht blicken einen die Leute in ein paar Jahren erstaunt an, wenn man sie daran erinnert, dass es früher mal andere Verfahren gab als KI, um Bilder zu machen.

Aaaaaber Reportage und Dokumentation zum Beispiel, Porträt oder Hochzeitsfotografie, die kann KI nie ersetzen. Mit „nie“ wäre ich immer vorsichtig. Bei Reportagen sehe ich einstweilen keine Konkurrenz der KI. Und auch im nichtprofessionellen Bereich wird Fotografie wohl weiter unersetzlich sein. Wer würde sich schon nach einer Reise nach Venedig anschließend von einer KI 500 Urlaubsfotos generieren lassen, selbst wenn diese bis ins Detail völlig realistisch und getreu wären?

Obwohl … wenn dereinst jeder über einen Datensatz seines Gesichts und Körpers verfügt, so dass die KI einen per Prompt auf den Markusplatz oder in eine Gondel platzieren kann (nein, da hatte ich doch die blaue Bluse an!) … warum soll man da noch dauernd auf den Auslöser drücken?

Und schaut man sich all die digital geschönten Selbstporträts in den sozialen Netzen an, warum sollten die Menschen dann noch zum teuren Fotografen gehen für ein Porträt? Mach mich mal vor einen Sonnenuntergang in Bali, meine Haare ein bisschen dunkler, den Pickel an der Stirn weg, und die Nase vielleicht einen Tick kürzer. Und tausch die Uhr gegen ’ne Rolex aus! Der einzige Unterschied zum Hochzeitsfoto: Da braucht man dann zwei Datensätze der Beteiligten. Und mailt dem Pfarrer, er solle doch bitte seinen auch mal für die Bildreihe freigeben.

Diese Visionen sind keinen Deut phantastischer oder erschreckender als die der Maler und Zeichner vor 150 Jahren beim Aufkommen der Fotografie. Hätte man denen die teuren Fotobildbände von einem Jahrhundert später gezeigt … und deren Fotografen die Möglichkeiten heutiger digitaler Bildbearbeitung … Also, mit den Worten des Philosophen James Bond: Sag niemals nie!

Dass junge Menschen, die gerade eine auf Fotografie und Gestaltung ausgelegte Ausbildung absolvieren und in wenigen Jahren abschließen, von derartigen Zukunftsvisionen nicht gerade begeistert sind, sondern nach dem Vortrag deprimiert heimwärts wanken, ist gut zu verstehen. Wahrscheinlich hatten es die meisten schon geahnt, aber niemand hatte es ihnen in dieser Klarheit gesagt. Angesichts dieser Perspektiven KI als bloßes Werkzeug zu betrachten, ist nicht leicht. Und sie gar als Partner einzuladen, noch weniger. Aber anders wird’s kaum funktionieren. Und selbst, wenn man KI als Gegner sieht, sollte man sich auf dem Laufenden halten, um ihre Entwicklung und ihre Möglichkeiten zu verstehen. Dafür gibt’s DOCMA: Mehr dazu in der nächsten Ausgabe.