
Abstract
Der Artikel beleuchtet die Rolle von sogenannten Training Data Creators, die für die Bereitstellung von Daten für KI-Algorithmen verantwortlich sind. Statt sich auf kreative Fotografie zu konzentrieren, liegt der Fokus dieser Arbeit darauf, gezielt Inhalte zu produzieren, die als Trainingsmaterial für Künstliche Intelligenz dienen können. Dies wirft die Frage auf, wie sich die Aufgaben und Prioritäten von Fotografen und Kreativen verändern, wenn sie nicht mehr primär für künstlerische Zwecke arbeiten, sondern für die Optimierung von KI-Systemen
Die generative Bilderzeugung durch Künstliche Intelligenz ist nicht weniger als eine Revolution für alle, die visuell arbeiten. Doch während die einen noch über die faszinierenden Möglichkeiten staunen, die Systeme wie Midjourney, DALL-E oder Stable Diffusion eröffnen, ringen andere bereits mit den existenziellen Fragen, die diese Technologien aufwerfen. Im Zentrum der Debatte: Wer liefert in Zukunft das Futter für die unersättlichen Algorithmen? Ein Heer von Training Data Creators? Droht uns eine visuelle Monokultur? Und erleben wir gerade eine beispiellose Umverteilung von Wertschöpfung zulasten der Kreativen? Fragen, die tief in die Struktur der professionellen Fotografie und Bildbearbeitung eingreifen.
Die Zahlen sprechen eine deutliche Sprache, auch wenn sie mit Vorsicht zu genießen sind, da die Dynamik enorm ist. Bereits Anfang 2024 berichtete die britische Society of Authors, dass 26 Prozent der Illustratoren Aufträge an KI-Systeme verloren hätten und 37 Prozent über spürbare Einkommensrückgänge klagten. Parallel dazu prognostizieren Marktbeobachter dem globalen Markt für KI-generierte Bilder bis 2030 ein Volumen von über 0,9 Milliarden US-Dollar. Ein Kuchen, von dem sich die Tech-Konzerne die größten Stücke sichern wollen, während die ursprünglichen Bildautoren oft leer ausgehen.
Der neue Rohstoff: Die Jagd nach Trainingsdaten
Die Qualität und der Umfang der Trainingsdaten sind der Flaschenhals für die Leistungsfähigkeit jeder KI. Wer also künftig die Abermillionen Bilder bereitstellt, die für das Anlernen und Verfeinern der Modelle benötigt werden, besetzt eine Schlüsselposition. Große Stockfoto-Agenturen wie Shutterstock, Adobe Stock und auch Plattformen wie Wirestock haben diesen Trend längst erkannt. Sie positionieren sich als Intermediäre und bieten Fotografen und Bildkünstlern an, ihre Werke für das KI-Training zu lizenzieren. Die Vergütungsmodelle sind dabei oft intransparent und die Erlöse für die Urheber meist deutlich geringer als bei klassischen Bildlizenzen.
Gleichzeitig etabliert sich ein neues Berufsbild: der „Training Data Creator“ oder Kurator für KI-Trainingsdatensätze. Diese Spezialisten liefern nicht einfach nur Masse, sondern Klasse: hochauflösende, präzise verschlagwortete, stilistisch diverse und vor allem rechtlich unbedenkliche Bilddaten. Es geht um die gezielte Aufbereitung von Material, das Algorithmen hilft, spezifische Ästhetiken, Objekte oder Kompositionen zu „verstehen“ und zu reproduzieren. Anbieter wie Moonvalley, die sich auf KI-Videogenerierung spezialisiert haben, gehen bereits dazu über, Trainingsmaterial direkt und exklusiv von Filmstudios und Rechteinhabern zu lizenzieren – ein Weg, der angesichts der zunehmenden Urheberrechtsdebatten Schule machen könnte.
Die Gefahr der visuellen Verarmung
Die Fokussierung auf bereits existierende, millionenfach im Netz verfügbare Bildwelten birgt jedoch eine nicht zu unterschätzende Gefahr: die visuelle Stagnation, ja sogar eine Verarmung. Wenn KI-Systeme primär mit dem gefüttert werden, was bereits populär und weit verbreitet ist, lernen sie vor allem, dieses zu imitieren und zu rekombinieren. Echte Innovation, das Brechen mit Sehgewohnheiten, das Entwickeln neuer visueller Sprachen – all das droht auf der Strecke zu bleiben. Es entsteht eine Art kreativer Echokammer, in der Algorithmen die statistisch wahrscheinlichsten Bildlösungen generieren, basierend auf dem Input der Vergangenheit.
Diese Tendenz zur Homogenisierung könnte durch die schiere Masse an KI-generierten Bildern noch verstärkt werden. Studien deuten darauf hin, dass Märkte, auf denen KI-generierte Bilder angeboten werden, eine signifikant höhere Anzahl aktiver Anbieter verzeichnen. Was zunächst nach Vielfalt klingt, kann schnell in eine Nivellierung des Durchschnitts münden. Für professionelle Fotografen und Bildbearbeiter, deren Expertise oft gerade in einer unverwechselbaren Handschrift und originellen Bildsprache liegt, ist dies eine bedenkliche Entwicklung. Ihre über Jahre entwickelte Ästhetik wird potenziell zur Massenware, reproduzierbar auf Knopfdruck.
Tektonische Verschiebungen: Die Ökonomie des Bildes im Umbruch
Die ökonomischen Verwerfungen, die wir derzeit beobachten, sind fundamental. Es geht nicht nur um einzelne verlorene Aufträge, sondern um eine tiefgreifende Umverteilung von Wertschöpfung und eine Neudefinition von geistigem Eigentum im digitalen Zeitalter. Kreative haben über Jahrzehnte Bildarchive und visuelle Stile geschaffen, die nun – oft ohne ihre explizite Zustimmung oder angemessene Kompensation – als Grundlage für kommerziell erfolgreiche KI-Modelle dienen.
Diese Umverteilung findet auf mehreren Ebenen statt:
- Direkte Einkommensverluste: Aufträge für Illustrationen, Stockfotografie oder auch Produktvisualisierungen gehen an KI-Systeme verloren oder werden nur noch zu deutlich geringeren Honoraren vergeben.
- Fehlende Vergütung für Trainingsdaten: Die Nutzung urheberrechtlich geschützter Werke als Trainingsmaterial erfolgt oft ohne Lizenzierung und Bezahlung der Urheber.
- Preisverfall: Das massenhafte Angebot an KI-generierten Bildern setzt die Preise für visuelle Inhalte generell unter Druck.
Die juristische Auseinandersetzung hat jedoch längst begonnen. Ein vielbeachtetes Urteil eines Bundesgerichts in Delaware gegen einen KI-Entwickler wegen der Nutzung urheberrechtlich geschützter Werke ohne Lizenz hat Signalwirkung. Weltweit sind zahlreiche Klagen von Künstlern, Verlagen und Nachrichtenagenturen gegen KI-Unternehmen anhängig. Der Ausgang dieser Verfahren wird maßgeblich darüber entscheiden, wie die Spielregeln in Zukunft aussehen.
Jenseits der Algorithmen: Neue Rollen für visuelle Profis
Trotz der unbestreitbaren Herausforderungen eröffnen sich mit dem Training Data Creator neue Betätigungsfelder für Fotografen und Bildbearbeiter, die bereit sind, sich den veränderten Bedingungen anzupassen. Der Bedarf an qualitativ hochwertigem, ethisch einwandfreiem und präzise aufbereitetem Trainingsmaterial wird weiter steigen. Hier können Fotografen mit ihrem geschulten Auge und technischen Know-how punkten, indem sie nicht nur Bilder liefern, sondern kuratierte Datensätze für spezifische KI-Anwendungen anfertigen.
Jenseits des Training Data Creators wandelt sich die Rolle des Fotografen möglicherweise hin zum „Creative Director“ für KI-Systeme. Es geht weniger um die Bedienung der Kamera als um die präzise Formulierung von Prompts, die Auswahl und Verfeinerung der KI-generierten Ergebnisse und die Integration dieser Elemente in komplexe visuelle Konzepte. Die Expertise in Bildkomposition, Lichtführung, Farbpsychologie und Postproduktion bleibt entscheidend, verlagert sich aber auf eine Metaebene. Die Fähigkeit, KI-generierte Rohfassungen zu anspruchsvollen Endprodukten zu veredeln, wird zu einer gefragten Kompetenz. Ausblick: Evolution statt Kapitulation
Die aktuelle Entwicklung als simplen „Raubzug“ zu bezeichnen, greift zu kurz, auch wenn die Sorgen vieler Kreativer mehr als berechtigt sind. Wir erleben eine technologisch getriebene Evolution der visuellen Kommunikation, die neue Werkzeuge, aber auch neue Herausforderungen mit sich bringt. Diejenigen, die bereit sind, sich intensiv mit den neuen Technologien auseinanderzusetzen, ihre Workflows anzupassen und die sich wandelnden Wertschöpfungsketten zu verstehen, werden auch in Zukunft eine wichtige Rolle spielen. Es geht darum, die KI nicht als Gegner, sondern als mächtiges Werkzeug zu begreifen, das – richtig eingesetzt – die eigenen kreativen Möglichkeiten erweitern kann. Die Zukunft der professionellen Bildgestaltung wird hybrid sein: eine intelligente Symbiose aus menschlicher Intuition, künstlerischer Vision und algorithmischer Potenz. Für Profis bedeutet das, am Ball zu bleiben, zu experimentieren und die eigene Rolle im kreativen Prozess immer wieder neu zu definieren.
Ich glaube kaum, dass man den Mangel an Trainingsdaten auf diesem Wege beheben kann. In der ungehemmt kolonialistischen Phase der KI-Entwicklung hatte man einfach alles Text- und Bildmaterial abgegriffen, das im Internet verfügbar war, und das war bereits das Maximum an Material, das man beschaffen kann. Besser wird’s nicht. Theoretisch könnte man die Content-Produktion anheizen, indem man Kreative massiv subventioniert, aber wo soll das Geld herkommen? Bislang haben alle Unternehmen, die kreativen Input brauchten, dessen Kosten immer weiter zu drücken versucht – Filmproduktionsfirmen, Verlage, Plattenfirmen und so weiter. Zur Abwechslung mal den Kreativen ein gutes Leben zu ermöglichen, damit sie noch mehr Content produzieren, ist eine – in gewisser Hinsicht – schöne Vorstellung, aber ich halte sie nicht für realistisch. Zumal den Kreativen klar sein wird, dass der unverhoffte Geldsegen so etwas wie eine letzte Abschlagszahlung sein soll – man will ja letztendlich die KI so weit bringen, dass menschliche Kreativität in nennenswertem Umfang gar nicht mehr nötig ist.
Das Problem der mangelnden Trainingsdaten lässt sich nicht lösen, indem man immer neue Datenquellen anbohrt, denn die KI-Systeme sind unersättlich. Es gibt bereits einen diminishing return für den steigenden Aufwand an Hardware und Trainingsdaten, was bedeutet, dass der Datenhunger der KI noch steigen wird und seine immer mühseligere Befriedigung am Ende wenig Nutzen bringt.
Ein KI-Ansatz, der auf solchen unerfüllbaren Voraussetzungen basiert, wird langfristig nirgendwo hin führen und muss durch einen anderen, nachhaltigeren ersetzt werden. Die Leitidee, man brauche nur noch mehr und noch schnellere Grafikchips auf noch größere Trainingskorpora ansetzen, um verbleibende – und erstaunlich hartnäckige – Probleme zu lösen, hat einige Jahre lang gute Ergebnisse gebracht, aber diese Phase liegt hinter uns.
Einfach noch mehr Bilder bringen sicherlich keine Verbesserung. Aber wenn man zum Beispiel mal einen Blick in den Trainingsdatensatz LAION-5B wirft, fällt auf, dass die Bildunterschriften oft nichts mit dem Bildinhalt zu tun haben. Mit Sachverstand in Text und Bild editierte Trainingsdatensätze könnten die Leistung der KIs vermutlich deutlich verbessern.
Ja, aber sorgfältig kuratierte Daten sind teuer. Wenn man KI-Modelle auf eng umschriebene Aufgaben trainieren will, kommt man mit kleineren Korpora aus, und dann lohnt es sich (und es ist praktikabel), die Qualität der Daten zu optimieren. Aber das Training der LLM ebenso wie der Bilder generierenden Modelle braucht so viele Texte und Bilder, dass man bei deren Qualität Abstriche machen muss – in der Hoffnung, dass der enthaltene Unsinn am Ende als Rauschen herausfällt.
Für eine qualitativ hochwertige Kuratierung bräuchte man Leute wie uns, aber wer könnte sich unsere Dienste leisten? Wie viele Bilder würden wir pro Tag schaffen und wären wir damit fertig, bevor die Sonne explodiert und die Erde verschlingt?
(Mal eine Anekdote: Ich höre regelmäßig einen Podcast von Lars Haider, dem Chefredakteur des Hamburger Abendblatts, und Alexander Klar, dem Direktor der Hamburger Kunsthalle, in dem sie jede Woche über ein Kunstwerk aus der Sammlung der Kunsthalle diskutieren. Jüngst ging es da um den Trojanischen Krieg, und Alexander Klar behauptete, Paris hätte am Ende seinen Vater Priamos aus der brennenden Stadt getragen. Stimmt doch gar nicht, dachte ich mir; es war vielmehr Aeneas, der seinen Vater Anchises auf den Schultern getragen hat, wie man in Vergils „Aeneis“ nachlesen kann. Solche Fehler unterlaufen jedem von uns mal, aber man sieht: Selbst wenn ein Kunsthallendirektor und Professor etwas sagt, muss man es noch einmal überprüfen.)