BlogHintergrundKI

KI braucht dich – als Hilfskraft

Ein Freund rief mich kürzlich an. Fotograf, seit zwanzig Jahren im Geschäft, Werbekunden, Architekturaufnahmen, gelegentlich Kunstprojekte. Er klang seltsam heiter. Er habe, sagte er, einen neuen Job. Ich fragte, was er fotografiere. Bananen, sagte er. Hunderte von Bananen. Von oben, von unten, von der Seite, geschält, halbgeschält, angebissen, überreif, grün. Für eine KI. Damit die lerne, was eine Banane ist.

Ich schwieg einen Moment. Dann fragte ich, ob das sein Ernst sei. Es war sein Ernst. Willkommen in der neuen Kreativwirtschaft.

Das Netz, das uns auffängt – oder fängt

Seit ein paar Jahren hören Kreative immer wieder denselben Satz: Die KI wird euren Job übernehmen. Texter, Illustratoren, Musiker, Fotografen, Cutter, Sprecher, Designer – alle sollen sich warm anziehen, weil der Algorithmus angeblich schon an der Tür klingelt. Und nun, da er tatsächlich angekommen ist, stellt sich heraus: Er kann die Klingel noch nicht ganz alleine bedienen. Er braucht Hilfe. Menschliche Hilfe. Am besten von jemandem, der etwas von Gestaltung versteht.

Das ist keine Erfindung. Das ist Marktreaktion. Plattformen wie Scale AI, Outlier AI, Appen oder Remotasks vermitteln seit Jahren kreative Fachleute als sogenannte AI Trainer oder Data Labeler an Technologiekonzerne.

Was Kreative für die Maschine tun

Nehmen wir die Illustratoren. Einige von ihnen werden derzeit dafür bezahlt, schlecht zu zeichnen. Absichtlich. Schiefe Häuser, einäugige Katzen, Proportionen, die jeder Physiognomie Hohn sprechen. Das Ziel: dem Modell beibringen, was Anfängerarbeit ist, damit es selbst besser wird. Der Profi als Pädagoge seiner eigenen Ablösung, sozusagen. Man muss das kurz sacken lassen.

Musiker sitzen derweil stundenlang vor Lautsprechern und hören sich KI-generierte Hintergrundmusik an. Ihre Aufgabe ist es, zu bewerten, ob das Ergebnis eher nach Zahnarztpraxis klingt, nach Einkaufszentrum oder nach einem echten Lied. Die Branche nennt das Quality Rating. Ich nenne es das entlohnte Ertragen von Klang, der niemanden berühren soll und meistens auch niemandem schadet, außer dem Zuhörer.

Texter und Comedians schreiben sarkastische Sätze: „Oh super, schon wieder Montag!“ und prüfen anschließend, ob das Sprachmodell den Unterton erkennt. Erkennt es ihn nicht, wird weiter trainiert. Erkennt es ihn, kommt der nächste Satz. Das geht stundenlang so. Es ist, als würde man einem nahezu blinden Grundschüler erklären, was ein Augenzwinkern bedeutet und dabei zehn Meter weit weg stehen.

Schauspieler und Sprecher nehmen Tausende von Sätzen auf: in verschiedenen Stimmungslagen, Akzenten, Lautstärken. Manchmal auch absichtlich schlecht. Zu roboterhaft, zu gehetzt, zu monoton. Damit die synthetische Stimme weiß, was sie nicht sein soll. Produktivität durch Karikatur.

Videoeditoren sichten KI-generierte Clips und dokumentieren Fehler: Ein Hemd wechselt die Farbe zwischen zwei Einstellungen. Eine Hand hat plötzlich sieben Finger. Der Himmel ist innerhalb von drei Sekunden von bewölkt auf strahlend blau gesprungen, ohne dass jemand daran gedacht hätte, das zu begründen. Diese Fehlerprotokolle sind die Trainingsdaten von morgen.

Grafikdesigner überprüfen, ob KI-generierte Markenmaterialien konsistent sind, ob das Unternehmensblau tatsächlich Unternehmensblau geblieben ist oder ob der Algorithmus zwischendurch auf Neongrün umgeschwenkt ist, weil er offenbar einen anderen ästhetischen Impuls hatte. Und Fotografen, um zum Ausgangspunkt zurückzukehren, fotografieren Bananen. Oder ungemachte Betten. Oder Cornflakes auf dem Küchenboden, weil Putzroboter verstehen müssen, wie echte Unordnung aussieht, und Stockfotos dafür zu ordentlich sind.

Das hat eine Geschichte

Wer das für neu hält, hat die Industriegeschichte nicht aufmerksam gelesen. Als Henry Ford das Fließband einführte, brauchte er keine Handwerker mehr, die ein ganzes Auto bauen konnten, aber er brauchte viele Menschen, die exakt eine Schraube anzogen, immer dieselbe, den ganzen Tag. Die Spezialisierung fraß die Generalisten. Erst später, mit der Automatisierung der Fließbänder, brauchte man wieder andere Menschen: solche, die den Robotern sagten, was sie tun sollten.

Das Muster wiederholt sich. Technologische Umbrüche vernichten keine Arbeit im Ganzen, sie verwandeln sie. Oft in etwas Seltsameres. Manchmal in etwas Würdeloseres. Manchmal in etwas, das aussieht wie Arbeit, sich aber anfühlt wie das Ausfüllen eines endlosen Fragebogens über das eigene Handwerk.

Was jetzt passiert, ist strukturell vertraut und im Detail absurd. Das Silicon Valley hat einen gigantischen Wissensbedarf. Es stillt ihn, indem es ausgerechnet die Menschen anheuert, deren Können es zu replizieren versucht. Die KI lernt Fotografieren von Fotografen. Sie lernt Schreiben von Texter. Sie lernt, was gute Melodien ist, von Musikern. Und sie lernt, was schlechte Kunst ist, von Künstlern, die sich gerade nichts Besseres leisten können.

Chancen, Risiken und die Frage, die niemand laut stellen will

Jetzt wäre es einfach, empört zu sein. Und ehrlich gesagt: ein bisschen Empörung stünde der Sache ganz gut. Wer möchte schon zum Lehrmeister seiner eigenen Ersetzung werden?

Aber es gibt eine andere Perspektive, die mindestens genauso berechtigt ist. Diese Jobs, so seltsam sie klingen, sind ein Beweis dafür, dass kreatives Urteilsvermögen nicht einfach wegdefiniert werden kann. Kein Modell der Welt weiß ohne menschliche Rückmeldung, ob ein Klang nervt oder berührt, ob ein Bild wirkt oder langweilt, ob ein Satz trifft oder am Ziel vorbeischrammt. Das ist kein schlechtes Argument für die Unersetzlichkeit des Menschlichen – auch wenn der Kontext, in dem dieses Argument gerade geführt wird, reichlich schräg ist.

Die wesentliche Frage ist eine andere: Wie lange? Wie lange braucht die Maschine noch menschliche Nachhilfe? Und was passiert, wenn sie es nicht mehr tut? Darauf hat die Branche keine Antwort, die man guten Gewissens als Beruhigung akzeptieren könnte. Man verweist auf neue Jobs, auf neue Rollen, auf den ewigen Wandel. Das mag stimmen. Es erklärt aber nicht, was der erfahrene Musikproduzent mit vierzig Jahren Gefühl für Dynamik und Arrangement dann tut, wenn das Modell ihn eines Tages nicht mehr braucht, um Fahrstuhlmusik zu bewerten.

Was bleibt

Mein Freund fotografiert weiterhin Bananen. Er sagt, es ist meditativ. Er hat gelernt, die Frucht wirklich anzusehen – das Licht auf der Schale, den Schatten, den Knick kurz vor der Überreife. Er sagt, er habe Bananen noch nie so gut verstanden wie jetzt.

Das klingt nach einer Pointe. Es ist aber auch eine Beobachtung über das, was passiert, wenn man sich professionell zwingt, auf das Offensichtliche zu achten. Vielleicht ist das der merkwürdige Nebeneffekt dieses ganzen Projekts: dass ein paar Menschen wirklich gut darin werden, Dinge zu sehen, die andere längst für selbstverständlich halten. Und dass die KI davon profitiert. Wenn auch, ohne je zu verstehen, warum eine angebissene Banane auf einem weißen Tisch etwas anderes ist als eine frische auf einem Holzbrett.

Munter bleiben.

Christoph Künne

Christoph Künne, von Haus aus Kulturwissenschaftler, forscht seit 1991 unabhängig zur Theorie und Praxis der Post-Photography. Er gründete 2002 das Kreativ-Magazin DOCMA zusammen mit Doc Baumann und hat neben unzähligen Artikeln in europäischen Fachmagazinen rund um die Themen Bildbearbeitung, Fotografie und Generative KI über 20 Bücher veröffentlicht.

Schreibe einen Kommentar

Bitte melden Sie sich an, um einen Kommentar zu schreiben.

Das könnte Dich interessieren
Schließen
Schaltfläche "Zurück zum Anfang"