BlogKI

Trübe Berufsaussichten

Warum ein Vortrag von Doc Baumann die Zuhörer traurig machte

Es kommt eher selten vor, dass viele Zuhörerinnen und Zuhörer eines Vortrags traurig und resigniert nach Hause gehen, obwohl sie eine Menge dazugelernt haben und den Inhalt interessant und hilfreich fanden. Diese Erfahrung musste Doc Baumann vor ein paar Tagen nach seiner Gastvorlesung an der Kunsthochschule HAWK in Hildesheim machen, in der er nicht nur über kunstwissenschaftliche Aspekte von bild-generativer KI sprach, sondern auch über die Berufsperspektiven, die sich in diesem Zusammenhang abzeichnen.

Alle Bilder wurden per KI mit dem folgenden Prompt erzeugt: »Professionelles detailliertes Foto: ein 25-jähriger Bettler, trauriger Gesichtsausdruck, zerrissene Kleidung, ein Becher vor sich, ein Roboter wirft eine Münze in diese Tasse, ein alter Laptop neben dem Bettler, der Bettler lehnt an einer Hauswand  in einer modernen, geschäftigen deutschen Fußgängerzone mit vielen Geschäften und Passanten, Regen«  Dabei schaffte es keine KI, zum Beispiel den spendenfreudigen Roboter im Bild erscheinen zu lassen. Dieses Bild wurde mit NightCafe/Stable Diffusion XL generiert, der Roboter per Inpainting in Photoshop eingefügt. Hoffen wir, dass die derzeit ausgebildeten Fotografen und Gestalter nicht so enden …

 

Diese neue Technik wird uns noch alle arbeitslos machen – und das, obwohl die damit geschaffenen Bilder leer und seelenlos sind und viele Mängel aufweisen. Wenn wir es nicht schaffen, das zu verhindern, stehen wir bald arbeitslos auf der Straße, und die paar Leute, die genug Geld haben, sich das nötige Equipment für die Beherrschung dieser neuen Technik leisten zu können, werden sich eine goldene Nase verdienen. Und das alles nur, weil unsere bisherigen Auftraggeber und Kunden nicht in der Lage sind, die ästhetischen Unterschiede zwischen diesem maschinell produzierten Bilderschrott und unseren Werken angemessen zu würdigen, hinter denen eine lange Ausbildung und jahrelange Erfahrung stecken!

Originalton 2023? Nein – eigentlich die knappe  Zusammenfassung dessen, was man Mitte des 19. Jahrhunderts lesen konnte, als die Fotografen begannen, den Malern und Zeichnern die Aufträge wegzunehmen.

Ob es nun die späte Rache und List der Geschichte ist, dass die damaligen Neuerer nun selbst davon bedroht sind, von der nächsten Welle bilderzeugender Technik davongespült zu werden, kann man sich zwar fragen – sehr viel weiterführen wird das aber nicht.

Zwei Versionen bei identischem Prompt mit Adobe Fiefly

In der nächsten DOCMA-Ausgabe 109 werden Sie einen Artikel von mir finden, der sich ausführlicher damit befassen wird, ob KI eher ein Jobkiller für Fotografen und Gestalter sein wird oder ein Werkzeug – anthropomorphisierender ausgedrückt: gar ein Partner.

Hier möchte ich nur kurz die Hoffnungen und Befürchtungen zusammenfassen, die nach meinem Vortrag in den Wortmeldungen zum Ausdruck kamen. Wie die Zukunft aussehen wird, weiß ich natürlich genauso wenig wie alle anderen. Aber ich kenne die Gewohnheit, Gegenwärtiges einfach linear in die Zukunft zu projizieren und daraus Prognosen abzuleiten. Das kam zum Beispiel in dem Kommentar zum Ausdruck, wie wichtig es sei, sich intensiv mit den Hintergründen der Promptstrukturen der verschiedenen KI-Systeme zu befassen, das sei die Zukunft.

Ich werde hier gewiss keine Wetten anbieten – aber nach meiner Einschätzung hat sich dieser Ansatz zu dem Zeitpunkt, an die diese Studenten voraussichtlich ihren Abschluss machen werden, längst erledigt. Noch vor ein, zwei Jahren war nicht absehbar, welche Qualitäten KI-generierte Bilder heute haben würden. Oh ja, zu viele Finger, verzerrte Gesichter, merkwürdig verrenkte Gliedmaßen, zerstückelte Schrift und vieles mehr! Klar, gibt es heute vereinzelt immer noch, aber eher als Ausnahme.

Mit identischem Prompt und Deep Dream Generator / PhotoMage

 

Ankündigungen der letzten Wochen – Neuro-Chips auf analoger Basis, die 10.000 mal schneller sein sollen als die derzeit verbauten, ein geheimnisvolles Projekt Q, das eine neue Stufe der KI einleiten soll usw. – lassen vermuten, dass auch diese Entwicklung nicht linear, sondern exponentiell sein wird. KI-Training mit den neuen Chips würde nicht mehr Monate benötigen, sondern Minuten. (Jedenfalls im Prinzip: Ein Jahr hat knapp 32 Millionen Sekunden, ein Zehntausendstel davon ist nicht einmal eine Stunde.) Und KI kann ja nicht nur, unter anderem, Bilder und Texte generieren, sondern auch Programmcodes schreiben. Und zwar zum Beispiel für die nächste KI-Generation, die noch mehr noch besser kann (unter anderem programmieren).

Klar, wohin die Reise geht? Sich auf den aktuellen Einschränkungen und Mängeln etwa von ChatGPT, Firefly, Midjourney, Stable Diffusion oder anderen auszuruhen, wäre recht kurzsichtig. Um bei den Bildern zu bleiben: Vieles spricht dafür, dass in absehbarer Zeit keine ausgefeilten Prompts mehr nötig sein werden, um das gewünschte Ergebnis zu erzielen. Eher interaktiv – und mit sehr viel Stromverbrauch – mit lockeren Anweisungen wie: ein paar mehr Wolken am Himmel, vor allem oben rechts, das Auto weiter nach hinten, etwas länger und schwarz statt blau, und das Lächeln der Frau könnte noch etwas ausgeprägter sein. (Je nach Weiterentwicklung der KI mit einem „bitte“ ergänzt oder nicht.)

Mit identischem Prompt und NightCafe / Stable Diffusion – im oberen Bild taucht immerhin mal ein Roboterchen auf, auch wenn er nichts spendet

 

Natürlich und nachvollziehbarerweise hört man so etwas nicht gern, wenn man gerade in einem Studium steckt, das in eine Berufstätigkeit als Fotograf oder Grafikerin münden soll. Da glaubt man dann gern, klar, das sei wohl eine kaum abwendbare Entwicklung – aber mal ehrlich: Ich denke, meine Sachen sind so gut, die wird eine KI sicherlich nie ersetzen können.

1986 habe ich das erste Buch in Deutschland gemacht, das mit DTP am Computer gesetzt und gestaltet wurde – mein Begleitband zu dem Film „Der Name der Rose“. Dieses neue Verfahren fand schnell die Aufmerksamkeit der Fachwelt und ich wurde vom Börsenverein des deutschen Buchhandels zu einer Tagung der Verlagshersteller für einen Vortrag darüber eingeladen, wie ich das gemacht hatte. Diese Leute sind für die Gestaltung und Produktion der Bücher zuständig, und ich trat dort zu einem Zeitpunkt auf, als viele Druckereien gerade ihre tonnenschweren Vorräte an Bleibuchstaben verschrottet und für viel Geld funkelnagelneue Lichtsatzmaschinen angeschafft und Qualifizierungskurse gebucht hatten.

Und dann komme ich mit meinem kleinen Macintosh unterm Arm, mit ein paar Fonts auf einer einzigen 400-KB-Diskette, und erkläre den versammelten Herrn (eine Dame war nach meiner Erinnerung nicht dabei), dieser schuhkartongroße Kasten könne – fast – all das auch, was ihre Anlagen leisten. Am Ende des Vortrags gab es höflichen Beifall, der Vorsitzende kam nach vorn, legte mir jovial die Hand auf die Schulter und erklärte, das sei ja alles ganz interessant – aber ich solle doch bitte nicht glauben, damit werde man jeweils ein richtig hochwertiges Buch oder eine Zeitschrift setzen können, sauber mit Blocksatz und so. Vielleicht könne der Edeka-Kaufmann an der Ecke damit in ein paar Jahren seine Sonderangebotszettel machen, aber eine andere Perspektive sehe er da nicht.

Ich grinste nur – ich hoffe, nicht zu unverschämt –, und sagte bescheiden: „Schau’n wir mal, wer zuletzt lacht …“

Heute weiß kaum noch jemand, was DTP (Deskop Publishing) überhaupt ist – nicht, weil es längst vergessen wäre, sondern weil es gar nichts anderes mehr gibt. Lichtsatz? Nie gehört! Es dauerte nicht so sonderlich lange, bis ich zuletzt lachen konnte. Dabei verlief die Entwicklung vergleichsweise gemächlich, gemessen an den heutigen Möglichkeiten der KI. Vielleicht blicken einen die Leute in ein paar Jahren erstaunt an, wenn man sie daran erinnert, dass es früher mal andere Verfahren gab als KI, um Bilder zu machen.

Aaaaaber, Reportage und Dokumentation zum Beispiel, Porträt oder Hochzeitsfotografie, die kann KI nie ersetzen. Mit „nie“ wäre ich immer vorsichtig. Bei Reportagen sehe ich einstweilen keine Konkurrenz der KI.  Und auch im nichtprofessionellen Bereich wird Fotografie wohl weiter unersetzlich sein. Wer würde sich schon nach einer Reise nach Venedig anschließend von einer KI 500 Urlaubsfotos generieren lassen, selbst wenn diese bis ins Detail völlig realistisch und getreu wären?

Obwohl … wenn dereinst jeder über einen Datensatz seines Gesichts und Körpers verfügt, so dass die KI einen per Prompt auf den Markusplatz oder in eine Gondel platzieren kann (nein, da hatte ich doch die blaue Bluse an!) … warum soll man da noch dauernd auf den Auslöser drücken?

Und schaut man sich all die digital geschönten Selbstporträts in den sozialen Netzen an, warum sollten die Menschen dann noch zum teuren Fotografen gehen für ein Porträt? Mach mich mal vor einen Sonnenuntergang in Bali, meine Haare ein bisschen dunkler, den Pickel an der Stirn weg, und die Nase vielleicht einen Tick kürzer. Und tausch die Uhr gegen ’ne Rolex aus! Der einzige Unterschied zum Hochzeitsfoto: Da braucht man dann zwei Datensätze der Beteiligten. Und mailt dem Pfarrer, er solle doch bitte seinen auch mal für die Bildreihe freigeben.

Diese Visionen sind keinen Deut phantastischer oder erschreckender als die der Maler und Zeichner vor 150 Jahren beim Aufkommen der Fotografie. Hätte man denen die teuren Fotobildbände von einem Jahrhundert später gezeigt … und deren Fotografen die Möglichkeiten heutiger digitaler Bildbearbeitung … Also, mit den Worten des Philosophen James Bond: Sag niemals nie!

Dass junge Menschen, die gerade eine auf Fotografie und Gestaltung ausgelegte Ausbildung absolvieren und in wenigen Jahren abschließen, von derartigen Zukunftsvisionen nicht gerade begeistert sind, sondern nach dem Vortrag deprimiert heimwärts wanken, ist gut zu verstehen. Wahrscheinlich hatten es die meisten schon geahnt, aber niemand hatte es ihnen in dieser Klarheit gesagt. Angesichts dieser Perspektiven KI als bloßes Werkzeug zu betrachten, ist nicht leicht. Und sie gar als Partner einzuladen, noch weniger. Aber anders wird’s kaum funktionieren. Und selbst, wenn man KI als Gegner sieht, sollte man sich auf dem Laufenden halten, um ihre Entwicklung und ihre Möglichkeiten zu verstehen. Dafür gibt’s DOCMA: Mehr dazu in der nächsten Ausgabe.

  

Im DOCMAshop finden Sie alle Infos zum aktuellen Heft: Das ausführliche Inhaltsverzeichnis, einige Seiten als Kostprobe sowie alle Möglichkeiten, das gedruckte Heft zu abonnieren. Erfahren Sie dort auch mehr über unsere preiswerten Online-Abos – jetzt ab 3,99 € pro Monat.

Zeig mehr

Doc Baumann

Doc Baumann befasst sich vor allem mit Montagen (und ihrer Kritik) sowie mit der Entlarvung von Bildfälschungen, außerdem mit digitalen grafischen und malerischen Arbeitstechniken. Der in den Medien immer wieder als „Photoshop-Papst“ Titulierte widmet sich seit 1984 der digitalen Bildbearbeitung und schreibt seit 1988 darüber.

Ähnliche Artikel

2 Kommentare

  1. Lieber Doc Baumann,
    ist es nicht so, dass die liebe KI Fotografien braucht, um all die bunten Bilder zu generieren? Noch findet sie aus Abermillionen Bildchen auf allen möglichen Plattformen viele Schnipsel, die sie wie ein Puzzle zusammensetzt. Aber was ist, wenn kein Mensch mehr fotografiert?
    Entsteht dann nicht sehr schnell ein Einerlei, also Bilder, die sich irgendwie wiederholen. Schon jetzt sehe ich Anleihen zu Kunstwerken oder Illustrationen, die mit Fotos generiert werden. Der Inhalt ist aber meistens gleich.
    Für mich ist die KI ein Armutszeugnis für Kreativkrüppel, die sich wichtig machen wollen. Und von der Gefahr der Bildmanipulation – siehe Ukraine oder Gaza – will ich gar nicht erst reden.
    Die KI kann in vielen Bereichen nützlich sein, aber sicherlich wird sie keine menschliche Kreativität ersetzen können. Sie wird eher dazu führen, dass die Kreativität verkrüppelt.
    Beste Grüße
    F-J

  2. Lieber F-J.
    Sie sprechen da in der Tat einen ganz wichtigen Aspekt an: KI braucht, auch für ihre qualitative Weiterentwicklung, auf jeden Fall Abermilliarden echter Fotos. Zum einen, um konkrete Objekte, Szenen und auch Personen noch detaillierter wiedergeben zu können. Zum anderen aber auch, weil die Verwendung von Trainingsbildern, die selbst KI-generiert wurden, nicht nur zu einem falschen Bild der Welt führen würde, sondern auch zu erheblichen Qualitätsmängeln, die sich in Form von Streifen oder Flecken auf neu generierten Bildern zeigen. Zahllose neue und verfügbare Fotos sind daher unverzichtbar.
    Allerdings sind (nicht nur Ihre) Vorstellungen über „Schnipsel, die wie ein Puzzle zusammengesetzt werden“, nicht richtig. Würde KI beim Training tatsächlich Milliarden Bilder speichern und diese immer wieder heranziehen, wenn neue generiert werden sollen, wären das gewaltige Datenmengen, die praktisch kaum zu handeln sind. Nicht, dass ich das wirklich verstehen würde als Nicht-Informatiker, aber gepeichert werden in einem vieldimensionalen „Raum“ eher Klassifizierungsmerkmale und keine Bildpixel. (Beiträge meines Kollegen Michael J. Hußmann helfen dabei, das besser zu kapieren.)
    Die Gefahr eines „Einerlei“ ist nicht zu leugnen – aber je besser die KI-Systeme werden, um so weniger ist derzeit so etwas zu erkennen. Ebenso richtig ist die Gefahr der Bildmanipulation. Aber das ist nichts Neues, das kriegen wir in Photoshop genauso hin, nur mit mehr Aufwand und dafür nötiger Kompetenz.
    Gar nicht zustimmen kann ich Ihnen bei dem Satz „Für mich ist die KI ein Armutszeugnis für Kreativkrüppel, die sich wichtig machen wollen.“ Er erinnert mich stark an das, was vor 150 Jahren geschrieben wurde, als diese „seelenlose Maschinenkunst“ der Fotografie begann, den Malern die Kunden wegzunehmen. Und auf die Prognose, KI könne „sicherlich keine menschliche Kreativität“ ersetzen, würde ich auch keine Wette abschließen. Dafür habe ich in meinem Leben dieses „wird nie ersetzen können“ schon viel zu oft gehört. Und auf sehr vieles, was in den letzten 150 Jahren im Kunstbereich als neu und kreativ gefeiert wurde, könnte ich gern verzichten. Ich denke, die menschliche Kreativität wird bestehen bleiben, sich aber zum Teil andere Anwendungsbereiche suchen müssen.

Schreiben Sie einen Kommentar

Bitte melden Sie sich an, um einen Kommentar zu schreiben.

Back to top button