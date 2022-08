Ein Tweet von „Blender Guru“ über die Zukunft von 3D (Link) brachte mich zum Nachdenken, wie denn die technische Zukunft von Fotografie und Bildbearbeitung aussehen könnte. In Teil 2 geht es um die möglichen Aussichten in Bezug auf Bildbearbeitung. Falls Sie den ersten Teil verpasst haben, finden Sie diesen hier.

Artworks, die mit der Midjourney-KI anhand von Texteingaben erzeugt wurden. © Midjourney

Die Gegenwart und Zukunft der Bildbearbeitung

Alles, was ich hier beschreibe, ist teilweise schon Realität. Viele der sich andeutenden Trends werden sich wahrscheinlich noch verstärken und beschleunigen. Bitte bedenken Sie: Das Folgende soll keine detaillierte Analyse sein. Ich halte nur einige meiner aktuellen Gedanken zum Thema fest. Dabei erhebe ich keinerlei prophetischen Anspruch 😉 und keinen auf Vollständigkeit. Aber schauen wir doch einmal.

Abonnements und Open Source

Abo, oje …

Die schlechte Nachricht gleich vornweg: Es wird in absehbarer Zeit wohl kaum noch Kaufsoftware (also eine Dauerlizenz) geben. Softwareentwicklung kostet Geld und Einmalverkäufe sowie periodische Updates reichen da wohl immer weniger, um die Kosten zu decken (siehe Pixelmator-Blog, englisch).

Abos haben den Vorteil, zunächst keine großen Kosten zu verursachen. Über die Zeit berechnet wird es aber meist teurer als eine Kaufversion – zumindest, wenn man bei der nicht jedes Update gekauft hätte. © PiyawatNandeenoparit – stock.adobe.com #315277428

Adobe hat es vorgemacht und liefert mit dem Foto Abo derzeit den Preis-Leistungs-Sieger mit großem Funktionsumfang ab. Skylum baut Luminar als neues Vertriebsmodell auf, bei dem das Abo die günstigste Wahl für ständig neu erscheinende Plug-ins ist (die ständige Neu- und Umentwicklung durch Skylum ist undurchsichtig und wenig vertrauenerweckend; ich teile da die Bedenken und Kritik von Thom Hogan in seinem englischen Blogbeitrag). Auch Pixelmator, von vielen Mac-Anwendern als moderne Photoshop-Alternative genutzt, wechselt zum Abo-Model (mehr Informationen im Hersteller-Blog, englisch). Ich denke, auch bei Affinity Photo ist es nur eine Frage der Zeit, bis auch Serif nicht mehr am Abo-Vertrieb herumkommt, obwohl gerade das immer deren Verkaufsargument war und noch ist. Auch dort wird über einen Wechsel zumindest nachgedacht, wie eine kürzliche Kundenumfrage nahelegt (es wurde die Frage gestellt, ob man lieber einmalig oder lieber häufiger kleine, regelmäßige Beträge für eine Software zahlt).

Das Problem ist, dass sich alle Angebote mit dem Adobe Foto-Abo messen lassen müssen, auf dessen Preisniveau (etwa 10 Euro/Monat) sich die meisten Mitbewerber offenbar einpendeln. Und da wird es natürlich schwierig mitzuhalten, wenn man den Funktionsumfang und die damit möglichen Workflows des Foto-Abos vergleicht (siehe meinen umfangreichen Premiumworkshop über die modernen CC-Workflows).

Open Source?

Die auf lange Sicht wohl einzige Alternative zu diesem Wettrennen ist vielleicht Open-Source-Software. Bei der 3D-Software Blender funktioniert das ja ganz hervorragend. Dank vieler Sponsoren ist die Entwicklungsgeschwindigkeit rasant und die Möglichkeiten unbegrenzt. Blender ist damit bereits konkurrenzfähig zu den alten Platzhirschen – bekommt aber in den großen 3D-Schmieden nur zögerlich einen Fuß in die Tür. Der Grund sind eingespielte Teams und individualisierte Arbeitsabläufe, die eben auf den bereits länger genutzten Programmen basieren. Ähnlich ist das bei der Bildbearbeitung. Photoshop mit seiner Plug-in-Schnittstelle, den Skripten, Erweiterungen, Aktionen … ist nicht so einfach in der Team-Produktion zu ersetzen. Der Bildbearbeitungseditor GIMP etwa hinkt auch bei den notwendigen Funktionen für professionelle Produktionen (das fängt schon bei Einstellungsebenen an) noch Jahre wenn nicht Jahrzehnte hinterher. Das ist dann eher etwas für private Gelegenheitsanwender.

Aber auch bei Blender bildet sich bereits rund um den Open-Source-Kern ein riesiger Markt an Erweiterungen, Diensten und Assets. Einige sind gratis, andere kauft man für mehr oder weniger Geld und andere, nun ja, sind eben im Abo verfügbar (beispielsweise Blenderkit) … das ist der Lauf der Dinge.

GPU- und Cloud-Berechnung

Raw-Konverter wie Capture One und auch Camera Raw und Lightroom liefern out-of-the-box bereits hervorragende Ergebnisse. Dank GPU-Beschleunigung muss man in den Raw-Konvertern und Bildbearbeitungsprogrammen wie Photoshop und Affinity Photo kaum noch auf die Ergebnisse von Korrekturen und Filtern warten (Luminar Neo mal außen vor; das lahmt bei fast allen Aktionen selbst auf meinem Mac Studio).

Cloudberechnung ermöglichen Ergebnisse auf Geräten, die mit ihrer eigenen Rechnerleistung dazu nicht in der Lage wären. Bei Spielen und 3D-Renderfarmen ist das schon Alltag – wie auch bei einige Neuralfiltern in Photoshop. © fotogestoeber – Adobe Stock #4033551

Einige Dinge lassen sich nicht auf heimischen Computern oder Mobilgeräten berechnen. Da müssen größere Geschütze aufgefahren werden, um das zu übernehmen. Der Weg der Zukunft ist das Berechnen über die Cloud, wie es schon beim Xbox Cloud Gaming oder bei Photoshops Neuralfiltern der Fall ist. Aufwendige Grafikberechnungen und KI-gestützte Algorithmen sind durch die Auslagerung in die Cloud auch auf schwachbrüstigen Rechnern und Mobil-Geräten möglich. Und damit sind wir schon beim wahrscheinlich wichtigsten Thema der Zukunft mit dem marktschreierischsten Schlagwort: KI – der künstlichen Intelligenz.

Künstliche Intelligenz

Eine wirkliche Intelligenz ist bei allen Nennungen von KI oder dem englischen Pendant AI (artificial intelligence) nie im Spiel. Immer geht es um Algorithmen (Was ist das überhaupt?), die durch maschinelles Lernen „programmiert“ worden sind. Mehr über neuronale Netze und Deep Learning erfahren Sie in diesem Blogbeitrag von Kollege Michael J. Hußmann.

Aber auch wenn hier kein Bewusstsein im Spiel ist, sind die Möglichkeiten und Anwendungsgebiete vielseitig und beeindruckend. Das, was jetzt schon möglich ist, wird in den kommenden Jahren weiter verbessert. Eine kleine Auswahl an Möglichkeiten und Beispielen:

Automatische Inhaltserkennung und Verschlagwortung per KI

Eine große Hilfe bei der Bildverwaltung und beim Wiederfinden von Bildern ist bereits jetzt die automatische Inhaltserkennung bei Bildern in der Apple Cloud oder bei Adobe Lightroom (Mobile/Cloud). Für Lightroom Classic leistet das Plug-in Excire Search gute Dienste, als Standalone Excire Foto. Aber es könnten noch viel mehr Details erkannt, Objekte, Tiere und Personen genauer identifiziert werden. Ich denke nicht, dass es hier demnächst einen großen neuen Durchbruch geben wird, sondern eine kontinuierliche aber überschaubare Verbesserung.

Die Gesichtersuche von Excire Search bietet bereits eine Reihe praktischer Kriterien zur Durchforstung des Bildbestandes.

Rauschreduzierung und Schärfung per KI

Bei der Schärfung und Verwacklungsreduzierung von Bildern ist Topaz Sharpen AI zurzeit ganz vorn dabei.

Eine Schärfung per KI kann bereits verwackelte Bilder retten, die man noch vor wenigen Jahren gelöscht hätte. Hier eine Schärfung mit Topaz Sharpen AI. © Olaf Giermann

Beim Entrauschen von Raw-Dateien ist der Platzhirsch meiner Meinung nach zurzeit DxO PureRaw. Mehr darüber finden Sie in meinem Blogbeitrag zur Version 2.

ISO 51200, mit bloßem Auge war kaum noch etwas zu erkennen. Was PureRaw hie rnoch herausholt, ist mindestens so beeindruckend, wie die modernen Kamerasensoren. © Olaf Giermann

Skalierung und Detailrekonstruktion per KI

Gigapixel vergrößert Bilder ohne Detailverlust und Remini rekonstruiert verwachsene Details. Was wie eine Schärfung wirkt, ist aber keine. Denn statt nur die Helligkeit vorhandener Pixel zu verändern, werden die Details eines Bildes erkannt und durch möglichst ähnliche, aber höher auflösende ersetzt. Die Ergebnisse können frappierend sein. Und das wird in Zukunft sicher noch zuverlässiger und beeindruckender funktionieren.

Die “Schärfung” mit Remini rekonstruiert Details so gekonnt, dass man auf eine irreführende Werbung hereinzufallen glaubt. Solche gab es ja in der Vergangenheit zur Genüge. Das hier gezeigte Beispiel ist jedoch echt. © Olaf Giermann

Einen Vergleich verschiedener Rekonstruktionsprogramme finden Sie im kommenden Heft DOCMA 103.

Retusche und automatische Bildverbesserung per KI

Auch den Retusche-Alltag wird KI nachhaltig verändern. Die automatische Bildverbesserung in Camera Raw und Lightroom basiert auf KI und schafft eine gute Ausgangsbasis für die weitere Optimierung.

Luminar Neo setzt auch auf KI. Sensorflecken oder störende Stromleitungen erkennt und entfernt die Software per Mausklick.

Störende Stromleitungen …

… entfernt Luminar Neo per Mausklick. Im Detail ist das Ergebnis noch nicht immer zufriedenstellend. Aber das wird sich mit Sicherheit schnell verbessern. © Olaf Giermann

Selbst die professionelle Hautretusche wird eines Tages niemand mehr per langwierigem Dodge-and-Burn durchführen. Ein gutes Auge braucht es dann immer noch, um etwa die automatischen Ergebnisse selektiv nach den Vorgaben der Auftraggeber abzustimmen. Aber was jetzt schon möglich ist, zeigen die Plug-ins von Retouch4me. Der hohe Preis jedes einzelnen Plug-ins amortisiert sich im professionellen Alltag schnell. Das Plug-in „Dodge-and-Burn“ erzeugt etwa eine Grauebene, wie sie auch ein Könner erzeugen würde – jedoch in einem Bruchteil der Zeit. Der Vorteil: Man kann dieser Ebene mit den altbewährten Techniken leicht den letzten Schliff geben.

Die erzeugte Grau-Ebene des Plug-ins “Dodge-and-Burn”. @ Retouch4me

Bildsegmentierung per KI

Ein großes Thema ist auch die Bildsegmentierung. Ist diese einmal perfektioniert, gehört das nervige Freistellen der Vergangenheit hat. Zwar ist jetzt schon dank »Objektauswahl-Werkzeug« und »Haare verfeinern« in Photoshop bereits einiges einfacher und schneller geworden. Die Qualität reicht meist aber nur für schnelle Optimierung für die Internetausgabe oder eben simple Memes. Oft muss man doch noch so viel korrigieren, dass man genauso schnell ist, wenn man gleich mit Zeichenstift und Kontrastmaskierung freigestellt hätte. Aber das wird sich definitiv ändern. Die KI-Modelle und deren Resultate werden immer besser. Objekt-ID-Masken, wie sie heute 3D-Programme erzeugen, werden durch KI auch aus Fotos automatisch abgeleitet werden.

Bei in 3D-Programmen gerenderten Bildern … @ Olaf Giermann

… werden Objektmasken automatisch mit gerendert. So ähnlich können Sie sich auch automatisch generierte Masken bei Fotos vorstellen. Statt Kanten mit dem Zeichenstift nachzufahren, reicht dann ein Klick mit dem Zauberstab (oder gleich mit dem Objektauswahl-Werkzeug).

Ganz neue Möglichkeiten bieten auch automatisch generierte Tiefenkarten. Mit dem Neuralfilter »Tiefenunschärfe« können Sie diese schon heute erzeugen. Nur die Qualität lässt oft noch zu wünschen übrig. Wenn diese einmal besser sind, können Sie Szenen neu beleuchten (siehe Premiumworkshop in Heft 103!), Farbe für Vorder- und Hintergrund getrennt einstellen und nachträglich die Schärfentiefe festlegen. Mobile Apps wie Focos zeigen, wie effektiv ein Userinterface für solche kreativen Optimierungen sein kann. Ein paar Screenshots aus meinem Video zum Premiumworkshop aus Heft 103:

Die mobile App Focos nutzt die vom iPhone erzeugte Tiefenkarte oder generiert per KI selbst eine solche und erlaubt die tiefenabhängige Bearbeitung einer Szene.

So eine Abdunklung des Hintergrunds eines alten Grenzsteins und virtuelle Beleuchtung desselben mit einer Taschenlampe ist dadurch einfach und gezielt ohne jedes Freistellen möglich.

Effekte und Bildstile per KI

Effekte. Looks und Bildstile sind eine kreative Spielwiese für Anwendungen mit künstlicher Intelligenz. Um nur ein Beispiel von vielen zu nennen: Sie könnten ein Foto in ein Gemälde im Stile van Goghs verwandeln.

© Olaf Giermann Die Umwandlung dieses Ausgangsfotos per KI gelingt …

… einmal wengier gut (per Photoshops derzeitigen Neuralfilter Stiltransfer. Oder …

… ziemlich gut mit der KI von Nightcafe.Studio. Van Gogh per KI? Die Qualität hängt vom Trainingszustand der KI ab.

Hier schlummert viel kreatives Potenzial. Wie wichtig es ist, die KI-Modelle mit den richtigen Ausgangsbildern für das maschinelle Lernen zu versorgen, sieht man an diesem Beispiel wunderschön. Nightcafe.Studio hat hier einen deutlichen Vorsprung.

Mimik, Pose, Beleuchtung per KI ändern

Was im Neuralfilter »Smart Portrait« zurzeit noch eher schlecht als recht funktioniert, wird sich in Zukunft deutlich verbessern. Das Anpassen des Gesichtsausdrucks, das Ändern der Kopfdrehung oder der Blickrichtung und das Ändern der Beleuchtungsrichtung wird fotorealistisch und schnell sein. Aktuell ist es noch ein Glücksspiel und man muss aufgrund der noch langsamen Cloudverarbeitung auch noch unverhältnismäßig lange auf die Ergebnisse warten.

Es gibt bereits KI-gestützte Verfahren, 3D-Modelle aus Fotos zu generieren, sodass diese frei drehbar sind (Beispiel von Nvidia). Zukünftig werden wir nicht mehr so leicht schmunzeln, wenn in einem Science-Fiction-Film mal die Rückseite einer Person oder eines Objektes aus einem verpixelten Foto plötzlich hochauflösend extrahiert wird. Klar muss Ihnen jedoch sein, dass diese Rückseite von der KI nur anhand vorherigem Training erfunden wurde. Das Ergebnis kann mit der Realität übereinstimmen, muss es aber nicht und wird es meist auch nicht.

Photoshops Neuralfilter »Samrt Portrait« befindet sich nicht ohne Grund noch in der Beta-Phase. Die Ergebnisse sind teilweise überraschend gut, oft aber nicht brauchbar.

Komplette Bildkreation per KI

Eine weitere, gerade top-angesagte Anwendung von künstlicher Intelligenz ist das Erzeugen von Bildern anhand von Text- oder Skizzen-Eingaben.

Kreation per Texteingabe

Was mit Dall-E Open AI und Midjourney möglich ist, grenzt schon an Magie. Personengeneratoren (Beispiel-Report, dass künstliche Personen sogar vertrauenswürdiger erscheinen als echte) erschaffen fotorealistische Porträts von Personen, die es nicht gibt.

Künstliche Personen erscheinen mitunter sogar vertraueneswürdiger als echte Menschen wie eine kürzliche Studie ergab.

Artworks, die mit der Midjourney-KI anhand von Texteingaben erzeugt wurden. © Midjourney

Bei Midjourney habe ich meine kostenlosen Credits bereits für einige Experimente verbraucht. Aber die Ergebnisse können sich bereits sehen lassen. Auch hier benötigt man übrigens ein Abo, das aber durch die benötigte Rechenleistung notwendig und absolut gerechtfertigt ist.

Roboter mit Waffen und Kirschblüte. Ich fand, das wäre eine tolle Aufgabe für Midjourny. 😉

Roboter mit Waffen und Kirschblüte. Ich fand, das wäre eine tolle Aufgabe für Midjourny. 😉

Kreation per Skizze

Dank PC und Nvidia-Studio (mehr Informationen, mein RTX-Laptop dafür ist von notebooksbilliger.de) kann ich auch mit Nvidia Canvas spielen. Hier wird der Ansatz verfolgt, der KI per Skizze mitzuteilen, was man erzeugen möchte. Es gibt also Himmel-, Wolken-, Berge-, Wasser- und so weiter –Werkzeuge, mit denen man das Bild grobschlächtig anlegt. Die KI ergänzt dann die Details und macht das Ergebnis fotorealistisch. Für eine Beta-Version sind die Ergebnisse schon recht ansehnlich. Also teilweise. 😉 Hier einige unterschiedlich komplexe Beispiele.





Drei mit Nvidia Canvas erzeugte Beispiele

Moderne UIs … Mobile … Zusammenarbeit …

Neben all dem KI-Gedöns, das freilich extrem faszinierend ist, würde ich mir auch eine erhebliche Verbesserung der traditionellen Werkzeuge wünschen. Das Userinterface der Photoshop-Korrekturen und -Filter (also auch die durch Affinity Photo kopierten) ist ziemlich in die Tage gekommen. Und damit meine ich nicht, wie hübsch diese aussehen, sondern welche Möglichkeiten sie bieten und wie ergonomisch und effektiv sie zu benutzen sind. Wie es besser (manchmal auch nur anders) geht, sieht man in Video- und 3D-Programmen. Dort gibt es Kurven für das Abstimmen von Sättigung und Farbton, Nodes für kreative und komplexe Verkettungen von Korrekturen, Kurven, die sich deutlich einfacher und flexibler ändern lassen als das olle Konzept der ausschließlich kanalweisen Steuerung (zielgenaue Farbeinstellungen per Mittelmaustastenklick und dergleichen; fast schon Sci-Fi für traditionelle 2D-Software). Pie-Menüs für den schnellen Zugriff auf Funktionen. Oder auch Farbkorrektur-Werkzeuge wie Gitternetze und dergleichen, wie Sie in DaVinci Resolve oder dem 3DLut Creator zu finden sind.

Der 3DLut Creator hat moderne und effektive Farboptimierungswerkzeuge, die sich in Photoshop und Co, ganz hervorragend machen würden. © Olaf Giermann

Ob es hier größere Innovationen geben, ist gegenüber den verkaufsfördernden eindrucksvollen KI-Zauberkästen wohl zweifelhaft. KI sieht eindrucksvoll in Demos aus und reicht für Webanwendungen jetzt oft schon aus. Damit holen die Softwarefirmen natürlich schon eine große Anwenderzahl ab. Professionelle Anwender können da nur Daumen drücken und hoffen, dass Adobe und Co. sie nicht vergessen haben.

In diesem Sinne.