Kann man einem Buch mit dem Titel „Midjourney. 201 Ideen und Prompts“ vorwerfen, dass es 201 Ideen und vor allem Prompts zu Midjourney enthält – und nichts anderes? Die Autoren sind der Meinung, sie hätten genau das geliefert, was der Titel verspricht – Doc Baumann dagegen findet, dass das ein bisschen dürftig ist.

Eine leider nicht untypische Doppelseite aus diesem Buch. Mit keinem Wort geht das Autorenduo darauf ein, dass der Prompt des Bildes links einen „sonnigen Tag“ verlangt, aber Regenwetter zeigt, oben rechts sollte eigentlich Rauch entstehen, was nicht der Fall ist. Warum wird das nicht einmal erwähnt, und warum zeigt man solche daneben gegangenen Bilder überhaupt? Um das Buch voll zu bekommen?

Ein Buch ist keine Erdnusspackung. Das ist keine weltbewegende Erkenntnis, ich weiß. Aber um den entscheidenden Unterschied dennoch zu erläutern: Dem Hersteller einer Dose mit Erdnüssen kann man nicht vorwerfen, wenn draufsteht „250 Gramm Erdnüsse“ … und dann ist tatsächlich nichts anderes drin ist als 250 Gramm Erdnüsse. Im Gegenteil, wir wären verärgert, wenn wir zusätzlich dort noch Gummibärchen und Kreuzschlitzschrauben entdeckten.

Ebensowenig würde ich den Autoren eines Buches mit Reisetipps für Venedig vorwerfen, dass sie nicht auch noch Tipps für Mailand, Miami und Madrid aufgenommen haben. Warum also dann meine Kritik an diesem Midjourney-Buch?

Ich lasse Sie mal in die Mail schauen, die ich dem Verfasser Stefan Kny dazu geschrieben habe:

„Bitte erlauben Sie mir, ganz ehrlich zu sein: Ich möchte das Buch – das wohlbehalten hier ankam, vielen Dank dafür – nicht besprechen. Es sei denn, Sie würden sich über einen Verriss freuen, der seiner Verbreitung aber wohl kaum dienlich sein würde.

Gewiss nicht vorzuwerfen ist dem Band, dass er in seinem Titel etwas anderes beschreiben würde, als der Inhalt dann bietet. Aber leider ist es auch nicht mehr als das. Wir wissen ja nun alle, dass es mit generativer KI keine Mühe macht, mit fast jedem x-beliebigen Prompt ansehnliche Bilder produzieren zu lassen. Und wenn keine herauskommen, hat man nach ein paar Sekunden neue Varianten.

Aber wer braucht ein Buch mit diesen Resultaten? Die kann sich jeder stundenlang selbst am Rechner generieren lassen. Für Anwender ist es zu wenig Information – für Leute, die nur schöne Bilder sehen möchten, zu viel.

Die Einbindung von ChatGPT und die Kapitelgliederung sind sicherlich schon mal ein guter Ansatz. Aber für ein Buch dazu, dass ich mit positiver Empfehlung rezensiere, würde ich doch deutlich mehr erwarten als jeweils eine halbe Seite Einführung, die noch dazu oft zu wenig konkret ist. (Schreibe ich als jemand, der seit 35 Jahren Bildbearbeitungs-Tutorials verfasst.)

Was Leser derzeit interessiert – bald wird das wohl so vereinfacht sein, dass es fast niemand mehr braucht –, ist die „Kunst“ der gezielten Prompt-Formulierung. Und dazu bietet Ihr Buch leider viel zu wenig – und das hatte ich eigentlich erwartet. Dann wäre es wirklich sinnvoller, gleich einen Band zu machen, der lediglich schöne KI-Bilder präsentiert. Dann weiß man als Leser, worauf man sich einlässt, und erwartet nichts in Form eines „Lehrbuchs“ im weitesten Sinn.

Um sicher zu gehen, dass ich hier nicht nur subjektive Bedenken hege, habe ich das noch mal mit unserem Chefredakteur besprochen (der zudem mehr Erfahrungen mit dieser KI hat als ich). Er kam leider zum selben Ergebnis.

Ein reiner Bildband mit schönen KI-Resultaten wäre in Ordnung gewesen, ohne Anspruch auf Prompt-Formulierungen usw., aber dafür ist dann wieder die Bildqualität zu schlecht.

Also, seien Sie bitte nicht böse, wenn wir deshalb auf eine Rezension verzichten möchten. Besser nichts als eine negative Bewertung.“

Man kann schon froh sein, wenn mehrere aufeinanderfolgende Seiten dasselbe Thema visualisieren. Viele Seiten sind einfach mit beliebigen, thematisch unzusammenhängenden Midjourney-Kreationen gefüllt.

Autor Stefan Kny ist nun aber ganz anderer Meinung und antwortete mir:

„Danke für Ihre Email und auch Ihre Begründungen. Normalerweise bekommt man ja die Kritik/Lob gar nicht vorab zugesandt. Sie sagen, wie es ist: das Buch hält das, was es verspricht. Nicht mehr und nicht weniger.

Ich verspreche im Titel nichts, was das Buch nicht halten kann. Anders sähe es aus, wenn ich den potentiellen Käufern, wie viele Blender (nicht die Software, kleiner Scherz) suggerieren würde, dass sie in die tiefsten Tiefen von Midjourney gelangen.

(Prompts, die im fast Modus mehrere Bilder erzeugen, habe ich bewusst weggelassen, das entspricht ja nicht dem Titel).

Das gesamte Wissen um Midjourney findet sich vermutlich eh’ komplett in der Midjourney Dokumentation, in Tutorials, Foren etc., oder man interviewt den Gründer persönlich, insofern wäre aus dieser Argumentationskette jeder Ratgeber obsolet.

Warum habe ich den Ratgeber geschrieben? Es fehlt den Leuten schlichtweg an Ideen und wie sie zu diesen kommen. Es ist ein wenig der IKEA-Effekt, wenn die eigenen Prompts zum Bild werden.

Ich/Wir stehen zu dem Ratgeber und müssen dann mit einem „Verriss“ leben.

Der Ratgeber richtete sich dann an die Leute, die Ideen brauchen. Ich habe als Fotograf viele Kollegen erlebt, die technisch brillant waren, deren Bilder es aber an Emotionen fehlte. Technisch perfekt, aber ideenlos. Das ist bei Midjourney nicht anders, wenn Prompts nur kopiert werden.

Zusammenfassend: Um Sie zu zitieren: Wir hätten dann Freude an einer negativen Kritik. Unser Ratgeber ist dann wohl eher Trivialliteratur statt Shakespeare, damit können und müssen wir leben.“

Mal davon abgesehen, dass ich es als Leser nicht schätze, von wildfremden Menschen mit Du angesprochen zu werden (wenn ich ungewollt geduzt werden will, gehe ich zu Ikea) – ein Thema wie „Zeitreise“ wird, typisch für fast alle Kapitel, gerade mal mit elf Zeilen eingeleitet, die kaum etwas aussagen. Hält man allerdings seine Leser wirklich für so ideenlos wie dieses Autorengespann, dann ist das sicherlich eine angemessene Vorgehensweise.

Das kann man so sehen. Ich sehe es nicht so. Ein Buch für Leute, die Ideen brauchen? Vielleicht setze ich ja als jemand, der seit vielen Jahrzehnten Tutorials verfasst, angesichts der Kompetenz von Leserinnen und Lesern von DOCMA zu viel voraus. Aber ich denke, ich habe zuerst ein Problem, etwa ein Bild an die Wand hängen zu wollen, und kaufe mir dann einen Hammer und ein Päckchen Nägel – und erwerbe nicht umgekehrt erst im Baumarkt den Hammer und grüble dann darüber nach, was ich damit mal machen könnte. Das wäre so, als würden wir Tutorials für Käufer von Photoshop machen, die nicht so recht wissen, warum sie diese Software überhaupt erworben haben, und nun Ideen suchen, was sie damit anstellen könnten, nachdem es sich als Datenbank und Musikgenerator als ungeeignet erwiesen hat.

Wie gesagt: Da bildgenerierende Idee auf nahezu jeden x-beliebigen Prompt mehr oder weniger ansehnliche Bilder auswirft, erscheint es mir überflüssig, Hunderte von Prompts und ihren Bild-Output zu präsentieren. Das ist ja nicht das Problem – dieses besteht darin, Prompts gezielt so zu formulieren, dass möglichst dabei etwas herauskommt, das nah an den Vorstellungen des Nutzers ist. Und das findet man hier nicht. Im Gegenteil, den Lesern werden sogar viele Bilder vorgesetzt, die der dazugehörigen Prompt-Formulierung widersprechen.

Neben unterschiedlichen Anwendungsgebieten werden zwar auch Parameter wie Gewichtung, Seed oder Verschlusszeit knapp erläutert, aber viel zu knapp und auch unsystematisch (auf „Verschlusszeit folgt „Werbephotographie“, auf „FoodPhotographie“ die „Gewichtung“). An das etwas angestaubte „Photographie“ muss man sich erst gewöhnen. Die Einbindung von ChatGPT für Prompt-Formulierungen wird erwähnt, könnte aber ebenfalls weiter ausgeführt werden.

Auch die typographische Qualität des Buches lässt sehr zu wünschen übrig. Statt mit einer Titelei beginnt es mit dem Impressum, und auch später gibt es diese einleitende Seite nicht. Im Inhaltsverzeichnis kleben die Punktreihen an Buchstaben und Seitenzahlen. Die kompress gesetzten Prompts sind nur mühsam lesbar, die Fließtexte zu Beginn der Kapitelanfänge wegen des zu kleinen Schriftgrades ebenfalls. Ohne dass eine grafische Funktion erkennbar wäre, gibt es mal fette schwarze Balken unter und über den Bildern, mal nicht. Und reicht das Material nicht, um eine Seite zu füllen, wird tatsächlich der alte Büchermacher-Witz in die Tat umgesetzt und die restliche Seite mit großzügig bemessenen Zeilen für eigene „Notizen“ eher geleert als gefüllt.

Mein Fazit: Ich halte das Buch für rundum überflüssig. Die Autoren sehen das natürlich anders. Und Sie können nun machen, was Sie wollen.

Christine Arnoldt, Stefan Kny

MIDJOURNEY. 201 Ideen & Prompts

The Publisher Gang, 2023

Taschenbuch (Print on Demand), 264 Seiten, voll farbig

Buch 21,35 € / Kindle 9,95 € (Amazon)

