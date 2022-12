Pandoras Box ist geöffnet. Bild by Olaf Giermann mit Stable Diffusion 1.5 lokal auf Nvidia-Grafikkarte, upscale mit Photoshop-Neuralfilter, partiell geschärft mit Topaz AI. Dreimal künstliche Intelligenz. Aber die Retusche des Fingerproblems habe ich mir einmal gespart. 😉

Wir leben in einer Zeitenwende. Kanzler Scholz bezog sich in seiner Rede vom 27. Februar 2022 auf die Veränderung des politischen Klimas durch Putins Angriff auf die Ukraine. Wir befinden uns aber womöglich mitten in einer viel größeren Umwälzung mit einer Vielzahl von Technologien, deren potenzielle Tragweite vielleicht nicht jedem bewusst ist. „Kunst“ per KI ist dabei nur ein ganz kleines Rädchen. Mein letzter Blogbeitrag für dieses Jahr und eine ausführlichere Bestandsaufnahme.

„Zeitenwende“ – Wort des Jahres

„Zeitenwende“ ist das Wort des Jahres 2022, gewählt von der Gesellschaft für deutsche Sprache (GfdS). Das Wort an sich ist nicht neu – es steht für einen beliebigen Übergang in eine neue Ära. Bundeskanzler Olaf Scholz sprach (Quelle) von einer Zeitenwende in Bezug auf das geänderte politisch-wirtschaftliche Klima in Europa und der Welt aufgrund des Angriffs Russlands auf die Ukraine am 24. Februar 2022. Es ist auch eine emotionale Wende, es gäbe wieder Angst vor einem Weltkrieg – gar einem Atomkrieg. Matthias Heine nennt „Zeitenwende“ in der Welt ein starkes Wort, an dem komme keiner vorbei. Und das trifft auch meiner Meinung nach zu. Aber nicht nur in Bezug auf die Weltpolitik.

Krieg schafft untder denen, die ihn für andere ausfechten und aushalten müssen, nur Leid – auf allen Seiten. © Olaf Giermann

Was passiert(e) denn gerade?

Wenn wir einmal von der vergänglichen Weltpolitik, der destruktiven Natur des Menschen, seinen schxxß Kriegen und den unsäglichen Verirrungen vieler Religionen und Ideologien absehen, dann entwickeln sich gerade viele Dinge, die große Veränderungen in der Geschichte der Menschheit darstellen könnten. Konjunktiv, denn sicher kann das ja niemand wissen! Vergleichbar ist in etwa die Kontrolle des Feuers, die Entwicklung der Schrift. Nur in einem viel größeren, disruptiven Ausmaß. Das betrifft alle Generationen nach uns. Und wir sind mittendrin. Das Internet ist bereits allgegenwärtig geworden. Eine kleine (recht willkürlich-spontane) Auswahl dessen, was ist und noch kommen mag. Keine Sorge, es geht auch um uns Fotografen und Bildbearbeiter. 😉

Kernfusion

So hat etwa erstmals ein experimenteller Kernfusionsreaktor gezündet und dabei mehr Energie erzeugt, als zur Zündung aufgewendet wurde. Zur effektiven Energieproduktion reicht das noch lange nicht und bis zur dauerhaften Energieerzeugung müssen noch viele andere Probleme gelöst werden. Aber das ist ein Meilenstein. Denn die Fusion ist unter kontrollierten Bedingungen wiederholbar. Es wäre eine fast unerschöpfliche und zudem recht sichere und saubere Energiequelle. Mehr Informationen. Diese Technologie könnte sogar dabei helfen, den gerade stattfindenden Klimawandel abzubremsen.

Kernfusion ist kompliziert. So ein Bild, um futuristische Technologie zu visualisieren, kann man mit den passenden Eingaben in Stable Diffusion aber selbst relativ einfach erzeugen. Bild by Olaf Giermann mit Stable Diffusion

Kosmologie und Raumfahrt

Dank des James-Webb-Weltraumteleskops blicken wir tiefer, schärfer und zeitlich weiter zurück ins All als je zuvor. Die Menschheit sollte sich mehr als je zuvor seiner Winzigkeit und Hybris bewusst werden. Und jeder einzelne Mensch sollte sich nicht für so wichtig nehmen, für wie er sich hält. Dass wir in diesem unfassbaren Universum leben, ist ein Wunder. Und wir schlagen einander immer noch die Köpfe ein. 🤦‍♂️

Jede noch so kleine Fleck ist eine Galaxie. Je röter, desto weiter entfernt und desto älter. Auch die prominenten Graviationslinseneffekte sind beeindruckend sichtbar. Die erste veröffentlichte Aufnahme nach Betriebsbeginn des Teleskops, veröffentlicht am 11. Juli 2022. © NASA

Der erste Flug rund um den Mond seit dem letzten bemannten Flug vor 50 Jahren ist erfolgreich inklusive Landung auf der Erde durchgeführt worden. Mehr Informationen Das macht den Weg frei für erneute bemannte Flüge – inklusive Landung auf dem Mond. Was wiederum den Weg ebnet für weitere bemannte Missionen zu anderen Planeten (Mars) und später Monden (etwa um Jupiter). Vorausgesetzt, wirtschaftliche Zwänge, Kriege, Religionen oder Ideologien machen das nicht zunichte. Leider schafft es die Menschheit bisher nicht, sich über diesen ganzen Unfug zu erheben.

Künstliche Fortpflanzung

Das könnte jetzt vielen Angst machen: Ectolife ermöglicht theoretisch außerkörperliche Schwangerschaften – inklusive Fortschrittskontrolle per App und optionalem Gen-Splicing für optimalen Nachwuchs. Höchst interessant und gruselig zugleich. Viel Potenzial, viele Gefahren. Und ein ethisches Minenfeld. Genau das Thema meiner dystopischen Artworks. 😉 (Guter Vorsatz für das nächste Jahr: Ich muss mir mal wieder mehr Zeit dafür nehmen.)

Nicht nur in meiner Serie „Futurum absolutum: AMNION“ habe ich die technologisch-künstliche Fortpflanzung ohne „Wirtskörper“ (Mutter) thematisiert. Von ethischen Fragen abgesehen, wäre eine solche heute schon möglich – so der verlinkte Artikel. © Olaf Giermann, in diesem Fall null KI dabei

Internet und künstliche Intelligenz

Die Bildgenerierung aus Texten ist das Schwerpunktthema der aktuellen DOCMA (Heft 104). Darauf möchte ich deshalb an dieser Stelle gar nicht tiefer eingehen. Nur soviel: Die Technik hat sich in diesem Jahr so rasant entwickelt und verbessert, dass man kaum noch Schritt halten kann, wenn man sich nicht ausschließlich für dieses Thema interessiert. Klar ist, dass diese Art der KI Künstler verärgert und sie um ihre Jobs bangen lässt. Denn alle Jobs, die unter einem bestimmten Anspruchsniveau liegen, werden unweigerlich entfallen. Wozu soll der Autor eines Romans noch einen Illustrator für das Titelblatt beauftragen? Er kann sich mit einer KI-Software einen Tag lang hinsetzen und durch Versuch und Irrtum tausende Bildvarianten per Texteingabe so lange erzeugen und variieren, bis er zufrieden ist. Das kostet aktuell keine 30 Euro im Monat (Midjourney-KI) oder bei lokaler Ausführung – außer der Nvidia- oder Mac-Hardware – nichts und erspart lange Einweisungen, Änderungswünsche und Diskussionen.

Das ist das allererste Ergebnis in Stable Diffusion, das ich als Resultat für ein Roman-Cover erhalten habe. Ein Alien-Raumschiff, das über antiken Alien-Ruinen schweben soll. Weit etnfernt von perfekt, aber ich habe schon schlechtere Buchcover gesehen. Mit etwas Tweaks oder in Midjourney wird das schnell wesentlich besser.

Bei alledem bleibt nur die Frage nach dem Copyright und dem Urheberrecht offen. Denn das ist alles Neuland, bei dem sich selbst Gerichte noch nicht einig sind (aktuelles Beispiel).

Aber sind solch große Veränderungen neu?

Von überall Texte, Bilder und Sprachnachrichten herumschicken zu können, war vor 30 Jahren noch eine Utopie für die meisten. Und was haben wir früher über hypothetische Deppen-Automatiken wie eine „Motivklingel“ beim Fotoapparat (nicht nur Gesicht-, Augen- und Motivautofokus sind schon Realität, sondern noch viel mehr) gespöttelt. Einen „Mach Kunst!“- oder „Mach das schön“-Knopf in Photoshop – ja, das war lustig. Dank KI aber schon Wirklichkeit (inhaltsbasiertes Entfernen, Neuralfilter, Beauty-Retouching-KI-Extensions, Luminar- und Topaz-AI und so viele mehr) – wenn auch noch nicht für jedermanns Geschmack anpassbar. Motivauswahl per Spracheingabe? Freistellen per Fingerdruck auf dem iPhone? Verwackelte Bilder schärfen? Bilder in CSI-Manier beeindruckend scharf hochskalieren? Aufwendige Retuschen per Inpainting und ein paar Pinselstrichen durchführen? Objekte in Bilder einfügen und automatisch mit Licht und Schatten beleuchten lassen? Aus Schallwellen an den Fensterscheiben den Aufbau von Zimmern und die Position der Personen darin feststellen – ja, auch um die Ecke „schauen“? Ein optischer Tarnumhang? – Alles – und noch viel mehr – schon Realität, die oft nur noch etwas Optimierung bedarf. Vergeben Sie mir, wenn ich jetzt nicht für jeden einzelnen Punkt eine Quelle verlinke. Aber alle Informationen dazu finden Sie schnell per Google heraus. Ich weiß noch, wie mir vor gefühlten „drei Millionen“ Jahren jemand in einer Newsgroup die neue, noch unbekannte, geniale Suchmaschine Google empfahl und ich von deren Ergebnissen extrem beeindruckt war. Heute ist sie Alltag. In Zukunft könnte Sie vielleicht niemand mehr kennen, weil ChatGPT übernimmt (Alarmstufe Rot bei Google).

So sah Google nach dem Start 1998 aus. Einfacher als jede andere bisherige Suchmaschine und dennoch viel treffsicherer und nützlicher als diese. Heute ist „googeln“ genauso ein gängiges Alltagswort wie „gephotoshoppt“. Aber wie lange noch?

ChatGPT

ChatGPT (einen guten Überblick finden Sie hier bei Heise.de) könnte das Ende von Google als Suchmaschine bedeuten. Denn mit dieser KI kann man sich wie mit einem Menschen unterhalten. Mit ChatGTP sind Rollenspiele und stundenlange Unterhaltungen möglich.

Mit ChatGPT im Ohr würde jeder bei „Wer wird Millionär?“ gewinnen.

Also den „Spirit“ von „Wer wird Millionär?“ hat Stable Diffusion ja schon irgendwie eingefangen. Hier sieht es dann aber doch nach einer ganz anderen Show aus.

Denn ChatGPT kennt per Machine Learning beinahe das gesamte Internetwissen und kann es verständlich vermitteln, Fragen und Zusammenhänge herstellen und in menschlicher Manier antworten. Ich würde sowohl medizinisch als auch rechtlich nicht meinen Hintern auf die Ergebnisse verwetten, aber sie sind in jedem Fall ein guter Startpunkt für die eigene, darauf aufbauende Recherche.

Ein Beispiel gefällig?

Ich habe ChatGPT gebeten, ein Wort zu erfinden, das es noch nicht gibt und es in wenigen Sätzen zu erläutern:

Per DeepL-KI (ja, auch eine immer besser werdende KI, die Sie übrigens neben der Translate-Funktion von Google benutzen können, um fremdsprachige Webseiten zu übersetzen, die ich hier mitunter verlinke) übersetzt:

Prompt: Bilde ein neues Wort für etwas, für das es noch kein Wort gibt. Erkläre das neue Wort in ein paar Sätzen.

Antwort: Das neue Wort, das ich kreieren werde, ist „solitudeity“ (Einsamkeit), das sich auf das Gefühl bezieht, allein und zufrieden in seiner eigenen Gesellschaft zu sein. Dieses Wort könnte verwendet werden, um das Gefühl zu beschreiben, die Einsamkeit zu genießen, oder den Zustand, sich mit dem Alleinsein wohlzufühlen. Jemand mit einem hohen Grad an Einsamkeit verbringt beispielsweise lieber Zeit allein als in Gesellschaft anderer und empfindet Einsamkeit als Quelle der Ruhe und Entspannung. Jemand mit geringem Einsamkeitsgefühl hingegen fühlt sich vielleicht ängstlich oder unwohl, wenn er allein ist, und sucht vielleicht die Gesellschaft anderer, um sich wohler zu fühlen.

So stellt sich Stable Diffusion im ersten Versuch „solitudeity“ anhand der Eingabe des neuen Wortes vor – inklusive Untertitel.

Ist das nicht beeindruckend (also der Text, weniger das Bild)?

Als Introvertierter können Sie das neue Wort vielleicht genauso gut verstehen und benötigen wie ich. Die beschriebenen Eigenschaften schwingen zwar schon bei „Solitude“ oder „Abgeschiedenheit“ mit, aber vielleicht nicht so eindeutig. Aber vielleicht verstehen Sie jetzt, wie ein Google-Angestellter zu der Auffassung kam, dass die von ihm betreute KI ein Bewusstsein erlangt hat (mehr Informationen).

Text2image-prompts per ChatGPT

Und wissen Sie was? Man kann den Chat-Bot darum bitten, eine gute Eingabe („Prompt“) für Text-zu-Bild-Generatoren wie Stable Diffusion, Midjourney, Dall-E zu generieren (Beispiel).

Sie müssen also nicht einmal mehr herausfinden, wie man die korrekten Eingaben bei Bild-KI-Generatoren am besten vornimmt. Sie benötigen nur noch eine Idee, fragen ChatGPT wie man die am besten umsetzt und voilà! Wie weit diese neuen Möglichkeiten gehen und wie viel besser (ich sage: massiv besser!) die Resultate werden, sehen wir in den nächsten Jahren. Schon im Jahr 2023.

Klar ist für mich: Die klassische Stockfotografie ist irgendwann tot. Wozu lange Stockfoto-Datenbanken durchsuchen, wenn man exakt das gewünschte Ergebnis in Sekunden per KI erzeugen kann? Adobe lässt bereits per KI generierte Bilder bei Adobe Stock zu (mehr Informationen). Fraglich und absolutes Neuland ist bei allem KI-Kram nur noch eins: das Urheberrecht (oder im englischsprachigen Raum das Copyright). Denn alle KI-Bilder sind durch Machine-Learning entstanden – also aus Fotos oder von Künstlern geschaffenen Bildern „inspiriert“ (meist noch ungefragt und unbezahlt!).

Noch ein ChatGPT-Beispiel gefällig?

Eigentlich wollte ich einen Blogpost über die Vorteile generativer Text-Bild-KIs schreiben. Dachte mir aber, ich frage mal ChatGTP. Mir scheint, ich bin als Blogschreiber auch überflüssig geworden …

Mein Prompt:

„Write a blog post about the benefits of text to image generative ai.“ (Sie können kein Englisch? Erinnern Sie sich an meine obige Empfehlung von DeepL?)

Antwort:

„Die generative Text-Bild-KI, auch bekannt als textbasierte Bilderzeugung, ist eine Art von KI, die auf der Grundlage von Texteingaben realistische Bilder erzeugen kann. Diese Technologie hat das Potenzial, verschiedene Branchen zu revolutionieren, darunter Kunst, Werbung und Design.

Einer der Hauptvorteile der textbasierten generativen KI ist die Möglichkeit, personalisierte Bilder zu erstellen. So kann ein Benutzer beispielsweise eine Beschreibung einer bestimmten Szene oder eines Objekts eingeben, und die KI generiert ein entsprechendes Bild. Auf diese Weise können sehr individuelle und einzigartige Bilder erstellt werden, die für verschiedene Anwendungen nützlich sein können.

Ein weiterer Vorteil der generativen Text-Bild-KI besteht darin, dass sie Zeit und Ressourcen spart. Anstatt Stunden damit zu verbringen, ein Bild von Grund auf zu erstellen, können Benutzer einfach eine Beschreibung eingeben und den Rest der KI überlassen. Dies kann besonders für Unternehmen und Organisationen nützlich sein, die schnell und effizient eine große Anzahl von Bildern erstellen müssen.

Neben den praktischen Anwendungen hat die generative Text-Bild-KI auch das Potenzial, unsere künstlerischen Fähigkeiten zu verbessern. Mit dieser Technologie können Künstler mit verschiedenen visuellen Ideen experimentieren und schnell entsprechende Bilder erzeugen. Dies kann die Schaffung neuer und aufregender visueller Kunst ermöglichen, aber auch die Fähigkeit, bestehende Ideen zu verfeinern und zu verbessern.

Insgesamt sind die Vorteile der generativen KI von Text zu Bild zahlreich und vielfältig. Vom Potenzial für die personalisierte Bilderstellung bis hin zur Zeit- und Ressourcen-Ersparnis hat diese Technologie das Potenzial, verschiedene Branchen zu revolutionieren und unsere künstlerischen Fähigkeiten zu verbessern.“

Rotkäppchen hat heute ganz andere Geschenke für die Oma im Waldhäuschen und viel schwerere Wackersteine für den bösen Wolf im Gepäck als in Grimms Märchen. Umdenken ist angesagt. 😉 © Olaf Giermann mit Stable Diffusion

Die disruptiven Auswirkungen aller KI-Entwicklungen

Alles, was heute Sachbearbeiter, Datenanalysten und Anwälte (und viele andere Berufe) erledigen, könnte in Zukunft auch durch eine KI durchgeführt werden. Fundierte Blogbeiträge schreiben, Belege für einen Steuerbescheid zusammensuchen und daraus eine optimale Steuererklärung erzeugen, Einspruchsschreiben gegen Amtsbescheide erstellen, ganze Stadtverwaltungen anhand der Daten aus tausenden verschiedenen Datenquellen automatisiert optimieren. Dinge, für die ein Beamter heute noch eine Woche benötigt, könnte in eine KI bald per Mausklick in Echtzeit erledigen.

Simple Alltags-Illustrationen benötigen, wie oben erwähnt, keine Illustratoren mehr. Aktien-Wahrsager können gegen eine mit einem Webcrawler kombinierte KI einpacken. Anderes Beispiel: Schon jetzt erkennt eine KI anhand von Röntgen- und Zell-Scans zuverlässiger und schneller Krebs als die besten Ärzte. Was glauben Sie, in welchen „Händen“ in Zukunft das Experten-Wissen und die direkte Anwendung und Analyse von Daten liegt?

KI – wenn auch noch nicht sich-seiner-selbstbewusst, wird immer wichtiger. Auch als Hilfsmittel in Expertenkreisen. Bild: Olaf Giermann mit Stable Diffusion

Das alles ist eine disruptive Technologie, die unser gesamtes Arbeits- und Gesellschaftssystem nachhaltig verändern könnte. Nicht nur Künstler müssen um ihre Jobs bangen. Die Auswirkungen sind wahrscheinlich viel umfassender, als wir es uns gerade vorstellen können.

Wie sich das Ganze auf das Leben der Menschen auswirkt, hängt aber wie immer von den Menschen selbst und ihrer Gesellschaft ab. Eine Ablehnung neuer Technologien bringt uns nicht weiter. Aber es braucht wohl in absehbarer Zeit neue Systeme für Wirtschaft, Wertschöpfung und Lebensunterhalt. Ich bin kein Zukunftswissenschaftler (die ohnehin wie die Religionspropheten zuverlässig daneben lagen und liegen). Ich sehe nur, wie die Verkäufe von Heften am Kiosk immer weiter sinken. In den meisten Zeitschriftenverkaufsregalen findet sich nur noch Klatsch und Tratsch neben den Produktionen großer Verlagshäuser. Ich sehe, wie sich (Stock-) Fotografen und manche Künstler bereits umorientieren, um ihren Lebensunterhalt zu bestreiten. Und ich sehe, was die noch dumme KI jetzt schon kann. Da brauche ich nur eins und eins für die nächsten Jahre zusammenzuzählen.

Frohes Fest!

Wie auch immer … wir leben in spannenden Zeiten! Panta rhei, bleiben Sie im Fluss und wir lesen, sehen und hören uns im neuen Jahr wieder. Bleiben Sie neugierig. Denn dabei kann ich Ihnen als (Neu)GIERmann weiter behilflich sein. Ich wünsche Ihnen fröhliche Feiertage und einen guten Rutsch ins neue Jahr. Das sollte logischerweise eigentlich zur Wintersonnenwende stattfinden, wenn Sie mich fragen! Aber das nur am Rande. 😉

Fröhliche Weihnachten, wie sich Stable Diffusion es gerade vorstellt. 😉

Bis denne dann!