BlogKI

Tilly Norwood: Wie eine KI-Schauspielerin die Medienlandschaft neu vermisst

Die Schmähreden klingen noch nach, fast schon rituell vorgetragen von Schauspielergewerkschaften und Hollywood-Veteranen: „Seelenlose Pixelhaufen“ könnten keine wahren Emotionen vermitteln, wer nicht aus Fleisch und Blut bestehe, sei kein Darsteller, sondern eine technische Spielerei, und überhaupt sei die Filmwelt besser gewesen, bevor Algorithmen anfingen, den Menschen die Arbeit wegzunehmen. Man kennt diese Litanei. Sie ist die erwartbare Reaktion einer etablierten Ordnung, die ihre Fundamente erbeben spürt. Doch seit der Vorstellung von Tilly Norwood auf dem Züricher Filmfestival 2025 ist die Diskussion um KI-Akteure aus dem Reich des Hypothetischen mit voller Wucht in der Realität aufgeschlagen.

Tilly – vollständig synthetisch, hervorgebracht aus der Zusammenarbeit des Studios Particle6 und der KI-Talentagentur Xicoia – steht plötzlich mitten auf der Weltbühne. Sie grinst uns täuschend menschlich von digitalen Plakatwänden und aus Social-Media-Feeds an und zwingt uns, die alten Gewissheiten zu hinterfragen. Sie ist keine bloße Animation mehr, sondern eine Entität mit eigener Biografie, einer digitalen Persönlichkeit und einer wachsenden Zahl von Agenten, die sich um ihre Vermarktung reißen.

Die digitale Chimäre

Was genau ist Tilly Norwood? Technisch betrachtet fußt ihre Existenz auf einem Amalgam aus generativen neuronalen Netzen (GANs) für die visuelle Darstellung und hochentwickelten Sprachmodellen für den Dialog. Ein System malt das Gesicht, ein anderes verleiht ihm eine Stimme. Doch Tilly ist mehr als die Summe ihrer technologischen Teile. Ihre Schöpfer haben sie mit einer detaillierten Hintergrundgeschichte versehen, die ihre „Persönlichkeit“ formt und ihre Handlungen plausibel erscheinen lässt. Sie altert nicht. Sie wird nicht müde. Sie fordert keine Millionengage und streikt nicht für bessere Arbeitsbedingungen. Sie ist die Inkarnation des perfekten, kontrollierbaren und unendlich formbaren Stars – ein Traum für Produzenten und ein Albtraum für jeden, dessen Einkommen von der eigenen, fehlbaren Menschlichkeit abhängt.

Diese Eigenschaften machen sie zum Brennpunkt eines tiefen Branchenkonflikts. Die Argumentationslinien verlaufen dabei klar und unversöhnlich.

Eine Welt in Aufruhr

Die Reaktionen auf Tillys Aufstieg zeichnen das Bild einer zutiefst gespaltenen Medienwelt. Eine Analyse der öffentlichen Äußerungen zeigt eine Kluft, die kaum zu überbrücken scheint. Auf der einen Seite steht die traditionelle Filmindustrie, deren Vertreter eine Mischung aus Angst und Verachtung zeigen. Hier fürchtet man den Verlust von Arbeitsplätzen, die Aushöhlung künstlerischer Authentizität und den Kontrollverlust über ein seit Jahrzehnten etabliertes System.

Auf der anderen Seite des Spektrums positionieren sich Tech-Unternehmen und KI-Entwickler mit einer positiven Resonanz. Sie sehen in Tilly nicht das Ende, sondern den Beginn einer neuen Ära kreativer Möglichkeiten: maßgeschneiderte Darsteller für Nischenmärkte, interaktive Erzählformate und eine Demokratisierung der Filmproduktion, die nicht länger von astronomischen Budgets und dem Zugang zu A-List-Stars abhängt.

Und die Öffentlichkeit? Sie steht dazwischen, fasziniert von der Neuheit, aber auch mit einer spürbaren Portion Skepsis. Der Applaus für die technische Brillanz mischt sich mit dem Unbehagen des „Uncanny Valley“ – jenem schmalen Grat, auf dem etwas fast, aber eben nicht ganz menschlich wirkt. Diese Ambivalenz ist der eigentliche Nährboden für die gesellschaftliche Debatte, die nun folgt.

Jenseits der Leinwand: Die Erosion der Authentizität

Was auf der Leinwand beginnt, endet selten dort. Die Technologien, die Tilly Leben einhauchen, sickern bereits in andere Bereiche der Medienproduktion ein und stellen dort noch fundamentalere Fragen. Im Journalismus experimentieren Sender wie in Kuwait mit KI-Nachrichtensprechern, und auch in Deutschland übernehmen synthetische Stimmen längst Verkehrs- und Wettermeldungen. Die Befürworter argumentieren mit Effizienz und der Möglichkeit, Informationen kostengünstig und rund um die Uhr bereitzustellen.

Doch die Risiken sind unübersehbar. Die entscheidende Währung im Journalismus ist Vertrauen, und dieses fußt auf der Annahme von Authentizität und redaktioneller Verantwortung. Was geschieht, wenn die Grenzen zwischen einem menschlichen Korrespondenten und einem KI-Avatar verschwimmen? Wenn eine synthetische Figur, deren Aussagen von einem Algorithmus auf Basis von Daten-Clustern geformt werden, als glaubwürdige Nachrichtenquelle auftritt?

Die virale Verbreitung von Deepfake-Bildern politischer Persönlichkeiten hat bereits einen Vorgeschmack darauf gegeben, wie schnell und effektiv synthetische Medien zur Desinformation missbraucht werden können. Die EU versucht zwar, mit dem AI Act durch Kennzeichnungspflichten für Transparenz zu sorgen, doch die entscheidende Schlacht wird nicht in den Gesetzestexten, sondern in den Köpfen der Rezipienten geschlagen. Es geht um die Fähigkeit zum kritischen Denken und die Bereitschaft, die Herkunft von Informationen zu hinterfragen – eine Kompetenz, die in einer von KI-generierten Inhalten gefluteten Welt überlebenswichtig wird.

Das Ende des Anfangs

Tilly Norwood und ihre digitalen Nachkommen werden menschliche Schauspieler nicht vollständig verdrängen. Aber sie werden den Beruf und die Kunst des Filmemachens unwiderruflich verändern. Sie zwingen uns, den Wert des Menschlichen neu zu definieren: die unvorhersehbare Improvisation, die aus gelebter Erfahrung gespeiste Emotion, die physische Präsenz, die ein digitaler Avatar niemals vollständig nachbilden kann.

Vielleicht wird die Fähigkeit, mit KI-Werkzeugen virtuos umzugehen, zu einer neuen Kernkompetenz für Kreative. Gleichzeitig könnte die rein menschliche, unperfekte und authentische Darbietung zu einem Luxusgut werden, das gerade wegen seiner Seltenheit an Wert gewinnt. Die entscheidende Frage ist nicht, ob wir diese Werkzeuge nutzen, sondern wofür. Wollen wir eine Zukunft, in der KI menschliche Kreativität ersetzt, um Kosten zu senken und Prozesse zu optimieren? Oder eine, in der sie als anspruchsvoller Sparringspartner dient, der uns herausfordert, bessere, tiefere und menschlichere Geschichten zu erzählen?

Tilly Norwood lächelt von der Leinwand, altert nicht einen Tag und wartet darauf, dass wir eine Antwort finden.

Christoph Künne

Christoph Künne, von Haus aus Kulturwissenschaftler, forscht seit 1991 unabhängig zur Theorie und Praxis der Post-Photography. Er gründete 2002 das Kreativ-Magazin DOCMA zusammen mit Doc Baumann und hat neben unzähligen Artikeln in europäischen Fachmagazinen rund um die Themen Bildbearbeitung, Fotografie und Generative KI über 20 Bücher veröffentlicht.

Kommentar

  1. Da fällt mir eine Entwicklung aus meiner Zeit ein: das Verschwinden der Fernsehansagerinnen. Die Jüngeren kennen es ja nicht, aber früher kam nach der Tagesschau nicht gleich der Krimi oder das Quiz, sondern man hörte einer Ansagerin zu, die über das Abendprogramm informierte und den nächsten Film anmoderierte. Zwischen den einzelnen Sendungen meldete sich immer wieder die Ansagerin, die damit eine Arbeitszeit bis kurz vor Sendeschluss hatte.

    Diese Ansagerinnen verschwanden schließlich, aber sie wurden nicht 1:1 ersetzt; stattdessen fiel die Moderation des Programms einfach weg, und zwischen den Sendungen wurden Trailer gesendet, die für die jeweils übernächste Sendung oder auch künftige Programme an den Folgetagen warben.

    Momentan hat es den Anschein, dass die KI zu einer 1:1-Ersetzung führt: Menschliche Stimmen werden durch synthetische Stimmen ersetzt (die idealerweise nicht mehr so künstlich wirken, falls man sich nicht mit Billig-Imitaten begnügt), echte Models durch KI-Kleiderständer und Schauspieler durch computergenerierte Avatare. Aber das wird vielleicht nicht in allen Fällen so bleiben. Was die künstlichen Stimmen betrifft, so frage ich mich sowieso, wozu sie gut sind, sofern der gesprochene Text nicht ad hoc generiert ist – das klassische Einsatzgebiet ist ja das Navigationssystem, und auch Ansagen auf Bahnhöfen oder in Bahnen und Bussen werden schon lange generiert, früher durch die Montage von Wörtern und Wortbestandteilen zu ganzen Sätzen und jetzt per KI. Aber längere fertige Texte lese ich lieber selbst, als dass ich sie mir vorlesen lasse. OK, das ist vielleicht eine Generationenfrage; wer in diesem Jahrhundert geboren ist, kann ja Texte oft nur noch erfassen, wenn sie ihm jemand vorliest, und längere Texte nur noch als KI-generierte Zusammenfassung. Wie ich jüngst einen Literaturdidaktiker im Deutschlandfunk erklären hörte, ist die Zeit, in der Studenten dicke Bücher, mit denen sie sich auseinandersetzen sollten, wirklich gelesen hatten, endgültig vorbei. Gar kein Problem, wurde eine Studentin zitiert: Sie lässt sich das Buch von der KI zu einem kurzweiligen Podcast aufbereiten, in dem zwei Sprecher den Inhalt vermitteln.

    Als gelernter Informatiker weiß ich ja, dass die ultimative Optimierung einer Computeranwendung darin besteht, sie vollständig überflüssig zu machen. Deshalb werden die 1:1-Kopien nicht unbedingt Bestand haben. Mir fällt in diesem Zusammenhang der Ikea-Katalog (heutzutage nur noch online und nicht mehr wie ehedem gedruckt verfügbar) als Beispiel ein: Ikea ist in vielen Märkten überall auf der Welt geschäftlich aktiv, und wenn sie ihre computergenerierten Bilder von Wohnungseinrichtungen mit darin lebenden Menschen interessanter gestalten wollten, mussten sie das Erscheinungsbild dieser Menschen an die Zielmärkte anpassen. In Saudi-Arabien konnten sie keine unverschleierten Hausfrauen in der Küche zeigen; vollverschleiert hätte es aber komisch ausgesehen und Männer bei der Hausarbeit, das ging natürlich gar nicht. Ikea hat das Problem dann auf die allereinfachste Weise gelöst: Sie zeigten weltweit (fast) gar keine Menschen mehr. Das war natürlich gleichzeitig die billigste Lösung, und die Möbel verkaufen sich auch so.

    Und was die Schauspielerei betrifft … Machen wir uns nichts vor: 95 Prozent von allem, was über irgendwelche Bildschirme flimmert, ist lieblos produzierter Schrott – es ist „Slop“, wie der Engländer sagt, also Schweinefraß, und ob es nun AI Slop oder dessen menschengemachte Variante ist, macht keinen großen Unterschied. Um das zu erkennen, braucht man ja nur mal in die Scripted-Reality-Programme und Vorabend-Soaps der Privaten reinzuzappen. Dasselbe gilt naturgemäß für Porno, und nicht nur in diesem Segment wird der KI-Einsatz für mehr Interaktion mit dem Betrachter sorgen, der virtuell Teil der Handlung werden kann. Das Ergebnis ist dann immer noch Schweinefraß, aber man suhlt sich mit Lust mittendrin.

    Als nächstes wird es vermutlich den Influencern und Influencerinnen an den Kragen gehen. Optisch stylen sie sich ja ohnehin schon zu einem generischen Influencertyp und machen es damit nur um so leichter, sie durch eine billigere KI-Dublette zu ersetzen. Allzu viel Bildung und Intelligenz muss ja nicht simuliert werden.

    Mein Eindruck ist, dass viele schon selbst an ihrer Ersetzbarkeit durch eine KI-Alternative arbeiten. Früher hatte man gewarnt, nicht auf eine Karriere als Topmodel zu hoffen, weil nur wenige die Voraussetzungen mitbrachten und nur die Allerwenigsten es tatsächlich schafften. Heute müsste man vielmehr sagen: Wenn Heidi Klum ohnehin besser weiß, wie Germany’s Next Topmodel aussehen soll, warum lässt man es sich dann nicht – samt ein paar Varianten – gleich per KI generieren? Wer sagt, „Ich möchte so sein wie der oder die“, erklärt damit die eigene Obsoleszenz, denn (etwas schlechtere) Kopien eines Originals zu produzieren, das ist die Domäne der KI.

Schreibe einen Kommentar

Bitte melden Sie sich an, um einen Kommentar zu schreiben.

Schaltfläche "Zurück zum Anfang"