Blog

Neues aus der KI-Wundertüte: Bildbearbeitungs-Magie (Einführung und Teil 1)

Kennen Sie Arthur C. Clarkes „Gesetze“? Olaf Giermann hat aktuelle Beispiele für wahrscheinlich schon in Kürze praktisch einsetzbare „Künstliche Intelligenz“ herausgesucht, die sie bestätigen. Heute: Dall-E 2. Pure Magie! Das Ende der Kreativitätsindustrie?

© Olaf Giermann. Neues aus der KI-Wundertüte: Bildbearbeitungs-Magie (Einführung und Teil 1)
© Olaf Giermann

Die Clarkeschen Gesetze

Informationen über Hintergrund und Ursprung der Axiome finden Sie auf Wikipedia. Die „Gesetze“:

  1. Gesetz: „Wenn ein angesehener, aber älterer Wissenschaftler behauptet, dass etwas möglich ist, hat er mit an Sicherheit grenzender Wahrscheinlichkeit recht. Wenn er behauptet, dass etwas unmöglich ist, hat er höchstwahrscheinlich unrecht.“
  2. Gesetz: „Der einzige Weg, die Grenzen des Möglichen zu finden, ist, ein klein wenig über diese hinaus in das Unmögliche vorzustoßen.“
  3. Gesetz: „Jede hinreichend fortschrittliche Technologie ist von Magie nicht zu unterscheiden.“

Unser bereits magischer Alltag

Das erste Clarkesche Gesetz hat sich schon mehrfach bewahrheitet, das zweite erscheint auf dem Niveau von Tagesweisheiten aus dem Sprüchebuch zu sein, aber das dritte ist doch schon etwas tiefgründiger. Denn, was ist überhaupt Magie? Für Religiöse ist alles unerklärliche Magie, was nicht vom jeweils präferierten Gott (der alles kann und keiner Erklärung der Rechtfertigung bedarf und damit doch nur das naive Ende jedes Hinterfragens darstellt) angeleiert wurde – und damit natürlich verboten. Gott an sich ist schon eine magische Vorstellung, aber gut. Das ist Definitionssache. Und die Definition ist nicht so einfach. Denn so vieles, was wir heute wie selbstverständlich nutzen, hat doch bereits etwas Magisches.

© Olaf Giermann. Neues aus der KI-Wundertüte: Bildbearbeitungs-Magie (Einführung und Teil 1)
© Olaf Giermann

GPS

Oder können Sie sich erklären, wie Ihr zuverlässiges GPS im Auto funktioniert? Wissen Sie, dass dafür relativistische Physik und hochpräzise Atomuhren erforderlich sind? Wissen und verstehen Sie, wie diese funktionieren? Also ich nicht. Aber ich nutze das sehr gern mit Smart-Watch und Phone. 😉

Kamera-Sensoren

Wie funktionieren diese Sensoren denn wirklich? Viele Fotografen können die Kinderphysikbuch-Erklärungen herunterbeten, wie Licht-Photonen aufgefangen und zeilenweise ausgelesen werden. Aber was passiert dabei wirklich? Dafür gibt es wiederum schön vereinfachte Abbildungen in Physik-Büchern. Nur: Elektronen-Orbitale und der Wechsel zwischen verschiedenen Anregungszuständen haben mit der Realität wenig zu tun. Es sind nur Modelle (!). Je genauer man sich für etwas wissenschaftlich interessiert, umso diffuser wird es. Atome, Quarks, Felder, Energie … Nun ja … letztlich Magie dann mehr oder weniger.

Künstliche Intelligenz (KI)

Bei KI ist es nicht anders. Da wird ein Prozess nach gewissen (bekannten) Regeln angestoßen, eine KI schafft neue Inhalte aufgrund bekannter Daten oder zwei oder mehr KI „streiten“ gegeneinander und am Ende kommt etwas Cooles heraus, das man nicht für möglich gehalten hätte. Es gibt aber keinen Code, den noch ein einzelner Mensch verstehen könnte. Magie irgendwie …

Dall-e 2: Wow!

Diese neue KI ist wirklich das Beeindruckendste seit Langem! Sie beschreiben der KI, was Sie sehen wollen und wie sie es sehen wollen. Ein Beispiel:

Textbeschreibung: EIn reitender Astronaut in fotorealistischem Stil. Neues aus der KI-Wundertüte: Bildbearbeitungs-Magie (Einführung und Teil 1)
Textbeschreibung: Ein reitender Astronaut in fotorealistischem Stil
Textbeschreibung: EIn reitender Astronaut als Bleistift-Zeichnung. Neues aus der KI-Wundertüte: Bildbearbeitungs-Magie (Einführung und Teil 1)
Textbeschreibung: EIn reitender Astronaut als Bleistift-Zeichnung

Leider habe ich es nicht in die zahlenmäßig beschränkte Beta-Phase geschafft, um das selbst einmal auszuprobieren. Aber mein Zugang in der wahrscheinlich langen Liste an Interessierten ist beantragt. Ich halte Sie auf dem Laufenden!

Auf der Open-AI-Website finden Sie einige Demos. In diesem englisch-sprachigen Youtube-Video werden die Fähigkeiten dieser KI hervorragend demonstriert:

Unbedingt anschauen!

Das Ende der Kreativitätsindustrie?

Eine wichtige Frage ist natürlich, wie sich solche Entwicklungen auf kreative Künstler, Medien und Bildbearbeitungscoaches wie uns/mich auswirken. Werden wir überflüssig, weil einfach jeder aussprechen kann („Es werde Licht!“), was er will und die KI erzeugt das gewünschte Ergebnis? Muss man nicht mehr lernen, eine Software zu beherrschen? Und gar nicht mehr fotografieren? Ist dies das Ende jedes Handwerks?

Mit Dall-e 2 generierte Bilder. Einzige Anweisung: Ein Teddybär auf einem Skatebpard auf dem Timesquare. Glaubhaft, realistisch und ohne Zutun eines Künstlers. Noch vor einigen Jahren hätte man eine solche, in einerm Film dargellte Technologie wohl als unrealistisch belächelt.
Mit Dall-e 2 generierte Bilder. Einzige Anweisung: Ein Teddybär auf einem Skateboard auf dem Timesquare. Glaubhaft, realistisch und ohne Zutun eines Künstlers. Noch vor einigen Jahren hätte man eine solche, in einem Film dargestellte Technologie wohl als unrealistisch belächelt.

Da ich kein Prophet bin, kann ich mich – wie alle bisherigen auch – nur so vage wie möglich verspekulieren. Bis dato sind jedenfalls alle KI-Resultate, die meist nur mit sehr winzigen Bildern trainiert werden, bei genauem Hinsehen und bei hoher Auflösung noch unterirdisch schlecht und benötigen menschliche Nacharbeit. Für Smartphone-Bildschirme reichen die Ergebnisse aber heute schon aus.

In Zukunft werden die Ergebnisse der künstlichen Intelligenzen aber besser und besser werden. Und ähnlicher und ähnlicher zu allem, was vorher schon erdacht und online verfügbar gemacht worden ist. Jede KI macht damit genau dasselbe, was jeder Kreative vor ihr schon getan hat: Aus Vorherigem etwas Neues erschaffen. Und da erscheint plötzlich das zweite Clarkesche Gesetz in einem ganz anderen Licht:

  1. Gesetz: „Der einzige Weg, die Grenzen des Möglichen zu finden, ist, ein klein wenig über diese hinaus in das Unmögliche vorzustoßen.“

Eine spannende Frage ist nun: Kann sich ein Mensch überhaupt etwas Neues ausdenken, zu dem eine künstliche Intelligenz nicht in der Lage wäre?

© fotodesign-jegg.de – Adobe Stock #33485530
© fotodesign-jegg.de – Adobe Stock #33485530

Was meinen Sie?

Zeig mehr

Olaf Giermann

Sein Erstkontakt mit Photoshop erfolgte 2003 an der Uni, an der das Programm als reine Scanner-Software eingesetzt wurde. Inzwischen gilt Giermann sprichwörtlich als das »Photoshop-Lexikon« im deutschsprachigen Raum und teilt sein Wissen in DOCMA, in Video­kursen und in Seminaren.

Ähnliche Artikel

Schreibe einen Kommentar

Das könnte Dich interessieren
Schließen
Schaltfläche "Zurück zum Anfang"