Text-zu-Bild-Systeme: Wissenslücken der KI

Alle Bilder, sofern nicht anders angegeben: Stable Diffusion / Michael J. Hußmann
Alle Bilder, sofern nicht anders angegeben: Stable Diffusion / Michael J. Hußmann

Die Weiterentwicklung von Text-zu-Bild-Systemen macht so rasante Fortschritte, dass Fotografen und Illustratoren bereits um ihre Jobs fürchten – einerseits. Andererseits unterlaufen solchen KI-Systemen oft eklatante Fehler, die ihnen nur mühsam ­abzutrainieren sind. Michael J. Hußmann klärt die Frage, warum sich die KI in manchen Bereichen immer noch schwer tut.

Obwohl die von KIs erzeugten Bilder von Monat zu Monat hochauflösender, detailreicher und realistischer zu werden scheinen, kommt es noch immer vor, dass die Kreationen bei genauerem Hinsehen befremdlich wirken: Gesichter und Körper erscheinen deformiert; Augen befinden sich nicht an der richtigen Stelle und die Zahl der Gliedmaßen oder deren Größenverhältnisse sind unstimmig – die Bilder wirken unfreiwillig surrealistisch. Warum kommt es noch immer zu so krassen Fehlern?

Neuronale Netze, wie sie dem hier zur Illustration verwendeten Stable Diffusion (javascript:alert(‚Der Link ist nur unsere docma2go-Nutzer verfügbar‘);) wie auch allen anderen Text-zu-Bild-Systemen zugrunde liegen, werden nicht …

Dieser Inhalt ist Teil unserer Premium-Inhalte von DOCMA2go.

Als Abonnent einloggen

DOCMA 2GO abonnieren

Das DOCMA-Magazin als wöchentliches E-Mail-Update. Mehr erfahren.

  • 30 Tage kostenlos
  • Danach nur 39,90 EUR/Jahr
2Go jetzt kostenlos testen!

Alle E-Abos vergleichen

Schreiben Sie einen Kommentar

Bitte melden Sie sich an, um einen Kommentar zu schreiben.

Back to top button