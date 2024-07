Kürzlich erschien ein ausführlicher Bericht, der Befragungsergebnisse von Künstlern und anderen Personen mit Kunstnähe vorstellte: „KI und bildende Kunst“. In Auftrag gegeben von der „Initiative Urheberrecht“ für die „Stiftung Kunstfonds“, durchgeführt von „Goldmedia“. Doc Baumann hat sich den Bericht kritisch angeschaut – gleich mehrfach qualifiziert als Kunstwissenschaftler, Anwender von generativer Bild-KI und Mitautor einer vergleichbaren Studie, die mit weitreichenden Folgen vor fast einem halben Jahrhundert durchgeführt wurde.

Von „sich“ aus käme eine KI nicht auf die „Idee“, das Spitzweg-Gemälde „Der Arme Poet“ um einen Roboter zu ergänzen, der KI-generierte Poesie verfasst und damit seinem Zimmergenossen die Lebensgrundlagen entzieht. Es braucht schon immer noch (noch!) einen Menschen, der Prompts verfasst und verfeinert, Auswahlen trifft und Mängel retuschiert. KI ist ein Werkzeug, kein eigenständiger Akteur.

Zunächst einmal sollten Sie sich, wenn Sie an dem Thema und der Befragungsauswertung wirklich interessiert sind, die Originalergebnisse anschauen (https://urheber.info/media/pages/diskurs/deutschlandweit-erste-studie-zu-auswirkungen-von-ki-auf-bildende-kunst/739c6eb83e-1719216426/goldmedia_ki-und-bildende-kunst_final_akt.pdf), denn auf Zahlen und Statistiken werde ich hier nicht eingehen. Und damit sollten Sie auf jeden Fall befassen, wenn Sie in diesem Bereich beruflich tätig sind. Mich interessieren die Überlegungen, die der Studie zugrundeliegen. Dabei habe ich, das sei vorausgeschickt, durchaus Verständnis für die wirtschaftlichen Sorgen von Künstlern angesichts der immer stärker werdenden KI-Konkurrenz. Allerdings denke ich, dass die Begründungen für ihre Forderungen recht schwach sind und oft von falschen Annahmen ausgehen.

Am Rande: Wären die Leistungen bildgenerativer KI so miserabel, wie es das auf diesem Weg erzeugte Aufmacherbild der Studie Unkundigen vorspiegelt, müsst kein Künstler Bedenken haben, KI könnte sein wirtschaftliches Überleben bedrohen.

Die Ausgangsfrage ist, wie sich künstlerische Berufstätigkeit durch das Aufkommen von KI verändern wird, in ökonomischer Hinsicht, aber auch kunstimmanent. Kurz zusammengefasst: Die wirtschaftlichen Aussichten sind eher düster und werden aus meiner Sicht in der Studie sogar noch zu optimistisch eingeschätzt. Um hier gleich mit der Kritik anzusetzen: In gewohnt elitärer Weise wird lediglich die „bildende Kunst“ in den Blick genommen, während zum Beispiel Illustrationen in Zusammenhang mit Nebenerwebstätigkeiten auftauchen: „Durch den Einsatz von KI entsteht ein unheimlicher Effizienzdruck. Und zwar weniger im Bereich der freien Kunst, sondern eher im Bereich der Dienstleistungen und der Kunstvermittlung, auf den viele Künstler:innen zusätzlich angewiesen sind.

Viele bildende Künstler:innen leben nicht ausschließlich von der Kunst allein, sondern betätigen sich nebenbei auch als Illustrator:in …“) Was dann gleich Anlass zur nächsten Kritik bietet; gut, dass meine Rechtschreibkorrektur mich daran erinnert: Die Studie wäre weitaus lesbarer und deutlich kürzer, würde man als Lesender (grauenvoll, oder?) nicht ständig mit – vorgeblich geschlechtergerechten, tatsächlich aber Menschen respektlos auf ihre sexuelle Identität als vorgeblich einzig wichtige reduzierenden – :innen-Sprachformen belästigt.

Nun ist die Tatsache, dass „Künstler“ – mit oder ohne Anführungsstriche – von ihrer künstlerischen Tätigkeit allein nicht leben können, durchaus nichts Neues, sondern spätestens seit einer ausführlichen Studie für das Bundesbildungsministerium bekannt, an der ich Ende der Siebzigerjahre beteiligt war und deren Ergebnisse 1983 zur Gründung der Künstlersozialkasse führten. Dazu entwarf ich den Fragebogen (252 DIN A4-Seiten), mit dem Hunderte Künstler persönlich befragt wurden. Das war die öffentliche Folge. Die private war, dass ich dabei viele Kunsthochschulabsolventen kennenlernte und seitdem weder diesen Berufsstand sonderlich schätze noch die Ergebnisse, die er hervorbringt.

Damals bin ich zu der Einsicht gelangt, dass die Gestaltung einer Modelleisenbahnanlage, das Customizing eines Motorrads oder die Pflege von Balkonblumen kaum anders einzuschätzen sind als „Kunst“. Diese persönliche Bewertung hätte nun in dieser Vorstellung der aktuellen Studie nichts zu suchen, hätte sie nicht auch allgemeingültige Folgen: Die genannten Tätigkeiten haben zum einen eine ästhetische Dimension und dienen zum anderen der Selbstverwirklichung der Menschen, die das machen. Doch niemand käme auf die Idee, es sei Aufgabe der Gesellschaft, Tätigkeiten wie den Aufbau einer Modelleisenbahnanlage aus Steuergeldern zu alimentieren, wenn jemand sie zum alleinigen Lebenszweck erheben möchte. (Und ich weiß aus zahllosen Gesprächen und Texten, wie wichtig es Künstlern ist, ihre individuelle Sicht auf die Welt etwa in Bildern auszudrücken – ob das jemand sehen möchte oder nicht.)

Wenn die aktuelle Studie – ähnlich wie unsere von 1980 – nun zu dem Ergebnis kommt, dass nur sehr wenige „künstlerisch“ Tätige von dieser Arbeit leben können (59% der Befragten beziehen daraus ein Jahreseinkommen von weniger als 5.000 Euro), dann lässt das eben auch den Schluss zu, dass der Bedarf an ihren Arbeitsergebnissen nicht sonderlich hoch ist. Es ist jedem zu gönnen, sich selbst zu verwirklichen, und es ist wunderbar, wenn man das auch noch mit einer auskömmlichen Erwerbstätigkeit verbinden kann. Aber warum sollte die Gesellschaft dafür aufkommen, Menschen zu finanzieren, an deren Produkten offenkundig wenig Bedarf besteht?

Zunächst fällt auf, dass die Tendenz der Studie und ihrer Befragungsergebnisse sehr an die Stimmung im künstlerischen Milieu Mitte des 19. Jahrhunderts erinnert, als die Fotografie immer wichtiger und preisgünstiger wurde. Bei vielen Texten und Aussagen über vorgeblich „seelenlose Maschinenkunst“ lässt sich kaum unterscheiden, ob sie sich 1860 auf die Fotografe oder 2024 auf KI-Bilder beziehen. (Übrigens auch eine gravierende Ungenauigkeit der Studie, wie sie ebenso bei der mehrfach zitierten Philosophin Dorothea Winter zu finden ist: KI bringt zunächst einmal Bilder – oder etwas anderes mit ästhetischem Charakter – hervor; ob die dann auch als „Kunstwerke“ gelten, ist eine völlig andere Frage, oder sollte es jedenfalls sein, wenn man beides nicht gleichsetzt oder verwechselt.) Ähnlich sah es aus, als um die Jahrtausendwende die Digitalfotografie professionell nutzbar wurde. Vorbehalte und Zurückweisungen, nach denen heute kein Hahn mehr kräht.

Im 19. Jahrhundert führte das dazu, dass das jahrhundertealte zentrale Paradigma der naturgetreuen Wiedergabe der Realität über den Haufen geworfen und nun plötzlich als vorgebliche Einschränkung wahrgenommen wurde – man konnte ja schlecht zugeben, dass die Fotografie diesen hohen Ansprüchen weitaus besser, schneller und billiger genügte und damit Bilder auch für ein Publikum erschwinglich wurden, das sich zuvor allenfalls einen Porträt-Scherenschnitt hatte leisten können. Die Parallelen zu heute sind unübersehbar.

Daher ist es so wichtig, zwischen bloßen Bildern und Kunstwerken zu unterscheiden: In Bereichen wie Illustration oder Stockfotografie werden menschliche Akteure bald nur noch in Ausnahmefällen benötigt. Ein Objekt ist aber nicht „ein Kunstwerk“, so wie eine Sitzgelegenheit ein Sessel ist; „Kunst“ ist die gesellschaftlich basierte Wertung eines Objekts mit vorwiegend ästhetischen Merkmalen. Die sich dann gegebenenfalls auch in einem bestimmten Preis ausdrückt.

Die Aspekte der Studie, die eine tiefgreifende Auswirkung von KI auf die weitere Entwicklung von Kunst ansprechen, sind also grundsätzlich durchaus bedenkenswert.

Kommen wir nun also zu dieser neuen „Studie zu Chancen und Risiken: KI und bildende Kunst“. Ich möchte einige Passagen kritisch kommentieren, die mir aufgefallen sind:

„Generative KI kann zu Zweifeln an der Authentizität jeglicher Kunst, deren Inhalte[n] und Vermittlung führen mit der Folge eines generellen Vertrauensverlustes in die Kunstszene insgesamt.“ Was soll das bedeuten? Da zeitgenössische Kunst den Anspruch aufgegeben hat, sichtbare Wirklichkeit in Bilder umzusetzen, kann „Authentizität“ nicht heißen, diesem Anspruch nachzukommen. Also ist damit wohl gemeint, dass man nicht länger weiß, ob etwas von einem Menschen oder einer KI stammt. Wenn man es als Rezipient unterscheiden kann, spricht das für den Produzenten (und den kundigen Betrachter). Doch für oder gegen wen spricht es, wenn man es nicht unterscheiden kann? Dann ist das eine nicht besser oder schlechter als das andere und die Frage der Urheberschaft wird irrelevant. (Außerdem vernachlässigt die Behauptung die Rolle der KI-Anwender, die nicht nur die KI verstehen müssen, sondern Prompts formulieren und in zahlreichen Schritten verfeinern, Vorschläge verwerfen, Auswahlen treffen, kombinieren, nachbearbeiten, ihre ästhetischen Erfahrungen in diese Prozesse einfließen lassen.) Und aus welchem Grund sollte man der Kunstszene „vertrauen“, und in Bezug worauf?

„Auf ökonomischer Seite schafft generative KI nicht nur neue Kunstformen, sondern ermöglicht Gruppen, die bisher ausgeschlossen waren, eine künstlerische Betätigung.“ Das erinnert an Beuys’ Satz „Jeder Mensch ist ein Künstler“, dessen einzige sinnvolle Bedeutung ist, dass der Begriff „Künstler“ aussagelos wäre, wäre der Satz wahr, weil es dann keine gut begründbaren Unterscheidungskriterien zu Nicht-Künstlern gäbe. KI ermöglicht Menschen, die ohne Lineal keinen geraden Strich hinkriegen würden, mit dem Werkzeug KI handwerklich perfekte Bilder zu produzieren. Wenn man die gleich für „Kunst“ hält, dürfte das nicht im Interesse der berufsständisch vertretenen Gruppe liegen. Und wenn die Behauptung richtig wäre, läge sie erst recht nicht im Interesse der Befragten, weil sich die Anzahl von Ergebnissen „künstlerischer Betätigung“ ins Unermessliche steigern würde.

„Manipulationen und Fälschungen abbildender Medien sind so alt wie das Medium selbst. Es bedarf jedoch zunehmend größerer Bildkompetenz, um die Qualität von Bildern und den damit verbundenen Grad ihrer Glaubwürdigkeit zu beurteilen.“ Das ist zwar richtig, stellt die Verhältnisse aber dennoch auf den Kopf. Professionell ausgeführte Photoshop-Montagen lassen sich auch nur, wenn überhaupt, mit hoher Bildkompetenz entlarven. Das eigentliche Problem liegt aber darin, dass die Produktion solcher Bilder keine sonderlich hohe Kompetenz mehr verlangt und ihre Verbreitung im Web und unkritische Rezeption in der Tat demokratiegefährdend sind.

„Viele der befragten Kunst-Rezipient:innen glauben, dass sie zwischen Realität und mithilfe von KI erschaffenen Erzeugnissen differenzieren können.“ Die Autoren der Studie glauben offensichtlich, dass sie zwischen der Realität und ihrer Abbildung differenzieren können, schaffen es aber bedauerlicherweise nicht. Sie meinen also offensichtlich nicht „Realität“, wenn sie „Realität“ schreiben, sondern die Vermutung, ob ein Objekt von einem Menschen oder mit Hilfe von KI produziert wurde.

„Kunstvermittelnde Akteur:innen äußern große Bedenken hinsichtlich der Auswirkung von KI auf künstlerische Kreativität und Authentizität. Kunst sei ein Vehikel, um menschliche Erfahrungen zum Ausdruck zu bringen. Darüber hinaus wählten Künstler:innen eher das Unwahrscheinliche als Ausdrucksform. Generative KI setze hingegen eher auf die wahrscheinlichen Optionen und berge somit die Gefahr, menschliche Kreativität und Innovation zu untergraben.“ Diese Argumentationsableitung ergibt wenig Sinn. 1. Gehen wir mal davon aus, das mit dem Vehikel für menschliche Erfahrungen sei eine empirisch korrekte Aussage. 2. Der Satz mit dem „Unwahrscheinlichen“ dagegen ist kaum empirisch begründbar. Wäre er wahr, widerspräche er dem Rest der Studie, denn der persönliche Stil eines Künstlers ist ein zentraler Aspekt für seine Käufer, eben weil sie dessen Wiedererkennbarkeit in weiteren Werken erwarten (vielleicht mit Ausnahme von Richter). Der wirtschaftliche Erfolg basiert daher gerade auf wahrscheinlichen und nicht auf unwahrscheinlichen Ausdrucksformen. Und eben die KI-Simulation des persönlichen Stils durch Bilder von Künstlern im Trainingsmaterial wird ja beklagt. 3. In der Tat generiert KI Bildelemente auf der Grundlage der Wahrscheinlichkeit, die mit diesem Trainingsmaterial gelernt wurde. Dennoch wissen KI-Anwender, dass die Resultate, die nach der Eingabe eines Prompts erzeugt werden, oft völlig überraschend (negativ wie positiv) sind und damit im Effekt praktisch durchaus unwahrscheinlich. 4. Würden aber wie behauptet menschliche Künstler vor allem Unwahrscheinliches und die KI Wahrscheinliches produzieren, würde das menschliche Kreativität und Innovation eben nicht untergraben, sondern im Gegenteil besondere Wertschätzung verdienen lassen – sofern die Rezipienten Unwahrscheinliches für wertvoller hielten als Wahrscheinliches.

Eine Künstlerin und Professorin wird an dieser Stelle mit den Worten zitiert: „Bildmanipulation hat zwar eine gewisse historische Kontinuität, aber erlebt nun mit generativer KI und digitalen Werkzeugen einen Quantensprung.“ Das wollen wir nicht hoffen, ist doch ein Quantensprung eine der kleinsten Änderungen eines Energieniveaus überhaupt. Die ständige falsche Verwendung des Begriffs durch physikalische Laien macht die Sache nicht besser.

Eine Galeristin wird mit der Forderung zitiert: „Ich halte es für eine absolute Pflicht, auf KI hinzuweisen, denn in ihr steckt nichts selbst Entwickeltes, sondern die KI reproduziert lediglich, was andere Künstler:innen gestaltet oder erfunden haben. Nach meinem Verständnis müssten diese Trainingsdaten offengelegt werden. Das hat nichts mit dem Eingriff in die künstlerische Freiheit zu tun. Wir schreiben ja auch ‚Öl auf Leinwand‘ oder ‚Acryl auf Leinwand‘, das ist nichts weiter als eine technische Information.“ Zunächst einmal dürfte es bei Milliarden von Trainingsbildern praktisch recht aufwendig sein, diese „offenzulegen“. Diese Forderung zieht sich durch die gesamte Studie – Offenlegung, Information, Honorierung, Verweigerungsmöglichkeit …

Sie geht aber von einem völligen Missverständnis der Verwendung des Trainingsmaterials aus. Viele Menschen scheinen sich das so vorzustellen, als würde die KI Bilder und Pixel speichern und sie nach Promptanweisung später wie bei einer Photoshop-Montage neu zusammensetzen. Wollte ich also etwa eine schwarze und eine weiße Katze auf einem roten Sessel darstellen, würde die KI nach diesem Verständnis ihre Datenbank nach Bildern schwarzer und weißer Katzen und roter Sessel durchsuchen, dann die ausuchen, wo alle von vorn zu sehen sind und aus einer bestimmten Höhe, danach alle ausschließen, bei denen das Licht nicht von links oben kommt usw. Doch so geht generative KI nicht vor, sie basiert auf abstrahierenden Konzepten von Objektklassen. Ebenso reproduziert die KI nicht, was andere (!) Künstler gestaltet oder erfunden haben – das ist vielleicht ein winziger Bruchteil. In jedes Bild fließt die Gesamtheit des Datenraums ein, und dabei sind x-mal mehr Alltagsknipsereien als „Kunstwerke“.

Noch schwerwiegender ist aber die kaum begründbare Unterscheidung zwischen menschlichen Akteuren und KI unter den Aspekten von Lernen und Beeinflussung. Wenn gefordert wird, KI-Anbieter müssten für Bilder, die einen Stil reproduzieren, Lizenzen zahlen, übersieht das gleich mehrere Punkte: Zum einen ist Stil aus guten Gründen urheberrechtlich gar nicht schützbar. Zum anderen beginnt kein Künstler bei Null und entwickelt einen eigenen Stil völlig unbeeinflusst von dem, was andere zuvor geschaffen haben; das ist in der Kunst nicht anders als in der Wissenschaft. Diesen Prozess nennt man bei Menschen zwar nicht Verarbeitung von Trainingsdaten, aber es läuft letztlich fast auf dasselbe hinaus. (Beim Aufnahmegespräch an der Kunstakademie wurde ich etwa gefragt, welche Künstler mich besonders beeinflusst hätten.) Drittens schließlich gibt es nicht nur individuelle Stile, sondern Stilrichtungen und Stilepochen. Nach dem Verständnis der in der Studie zitierten Kritiker hätten sich die unter einem Stil Zusammengefassten gegenseitig mit Prozessen und Schadenersatzforderungen überziehen müssen, weil Stilelemente aus vorhandenen Bildern in neue übernommen wurden.

Ein hervorragendes Beispiel für diese Sichtweise bietet der polnische Illustrator Greg Rutkowski, der besonders vehement gegen KI-generierte Bilder in seinem Stil vorgeht. Auch hier ist persönlich durchaus nachvollziehbar, dass sich jemand darüber ärgert, dass es inzwischen mehr „Rutkowski“-Bilder mit KI-Ursprung gibt als von ihm selbst produzierte. Aber wer sich ein wenig in diesem Genre auskennt, sieht auf den ersten Blick, dass es einen eigenständigen Rutkowski-Stil ohne die Einflüsse von Fantasy-Illustratoren wie Frank Frazetta, Boris Vallejo oder der Brüder Hildebrandt nicht gäbe. Wer im Glashaus sitzt …

Diese Einwände bedeuten übrigens nicht, dass etwas dagegenspräche, KI-generierte Bilder als solche zu kennzeichnen. Nur „stammen“ gute – nicht Allerwelts- – Bilder dieser Art eben nicht von Midjourney oder Deep Dream Generator, ebenso wenig wie ein Gemälde vom Hersteller der Acrylfarbentuben oder der verwendeten Pinsel stammt. KI ist ein Werkzeug, kein Akteur.

Allenfalls könnte man KI-Nutzer in Analogie zu Auftraggebern behandeln. Interessanterweise hat es die bildende Kunst geschafft, die Namen von Malern und Zeichnern mit ihren Bildern zu verknüpfen, während nur Fachleute wissen, wer die Auftraggeber waren. Bei Architektur etwa ist es umgekehrt; man weiß, dass Kaiser XY ihr „Erbauer“ war, kennt oft kaum den Architekten, und wer die Bauleute waren, ist meist nicht einmal Historikern bekannt.

Noch einmal also: Die in der Studie zum Ausdruck kommenden wirtschaftlichen Ängste sind durchaus nachvollziehbar. Nur die Begründungen sind es nicht. Sind menschengemachte Werke – nach welchen Kriterien auch immer – besser als KI-generierte, gibt es nichts zu befürchten. Sind KI-generierte besser oder ist zumindest ein Unterschied ohne Spezialwissen durch bloßen Augenschein nicht erkennbar, ist es schwierig zu argumentieren, warum das weniger Überzeugende zulasten des Besseren aufgewertet und geschützt werden sollte. Dann werden alle Proteste und Bedenken die zunehmende Bedeutung von generativer KI so wenig aufhalten, wie die Handweber den Siegeszug der Webmaschinen stoppen konnten oder die (mittelmäßigen) Maler und Zeichner im 19. Jahrhundert den der Fotografie, oder Analogfotografen vor 20 Jahren den digitaler Kameras und digitaler Bildoptimierung.

Das heißt übrigens nicht, dass man darüber begeistert sein muss, dass KI – mit zunehmender Perfektion – Bilder, Texte oder Musikstücke generiert. Es macht uns Menschen wieder ein bisschen unwichtiger. Aber wir sind ja auch schon damit klargekommen, dass uns Kopernikus, Darwin oder Freud aufgezeigt haben, dass wir nicht so bedeutsam sind, wie wir immer gedacht haben.

Hier wurde Spitzwegs Gemälde im ersten Schritt in Deep Dream Generator beschrieben, danach der Text des so entstandenen Prompts so modifiziert, dass statt des Poeten ein dichtender Roboter im Bett liegt. Der Prompt: »a professional ultrarealistic photo, style Spitzweg, of a robot reclining in a cozy, cluttered attic room. The robot is surrounded by fluffy white pillows and covered with a white blanket up to his waist. His right arm is resting on a stack of red and brown books to his side, and he is is writing a poem on a laptop. To his left, a wooden coat rack holds a dark jacket and a colorful towel is draped over a beam that extends over a small, square window. An oil lamp sits on a wooden stove, with a basin on it, and there are more books piled on the floor alongside newspapers, one open, revealing text and images. A black, opened umbrella is suspended mid-air, floating above him as if caught in a breeze. The wooden beams on the ceiling and walls give a sense of rustic charm, with a decorative item hanging from one beam and cobwebs in the corners. The light source from the window casts a warm, natural light into the room, highlighting the dust motes in the air and creating a serene, intimate atmosphere.«