KISoftware

Stable Diffusion XL in der Version 1.0

Stable Diffusion XL in der Version 1.0

Stability AI hat die neueste Version ihres textbasierten Bildgenerierungsmodells, Stable Diffusion XL (SDXL) 1.0, vorgestellt. SDXL 1.0 ist das jüngste und fortschrittlichste Modell im Portfolio des Unternehmens und wird Entwicklern offen zugänglich gemacht. Es gibt auch wieder eine API, also eine Schnittstelle zur Integration in andere Programme. Stable Diffusion XL kann man via Github kostenlos auf dem eigenen Rechner installieren oder es alternativ über die Frontends von Clipdrop und DreamStudio nutzen.

Stable Diffusion XL in der Version 1.0

Stable Diffusion XL: Die Neuerungen

Die Leistung von Stable Diffusion XL 1.0 will neue Maßstäbe in der textbasierten Bildgenerierung setzen. SDXL wurde weiter optimiert und verfeinert, um lebendigere und genauere Farben, verbesserte Kontraste, Beleuchtung und Schatten zu erzeugen. Ferner soll der Bildgenerierungsprozess erheblich beschleunigt worden sein. Er liefert nun innerhalb von Sekunden vollauflösende Bilder von einem Megapixel Größe (1024 × 1024 Pixel) in verschiedenen Seitenverhältnissen. SDXL 1.0 zeichnet sich außerdem durch eine der größten Parameterzahlen aller öffentlich zugänglichen Bildmodelle aus. Es basiert auf einem 3,5 Milliarden Parameter starken Basis-Modell. Hinzu kommt eine 6,6 Milliarden Parameter umfassende Modell-Ensemble-Pipeline. Diese eher kryptische Angabe in der Pressemeldung bedeutet vermutlich, dass mehrere verschiedene Modelle oder Varianten des Modells verwendet werden, um ein endgültiges Bild zu generieren, wobei jedes Modell zur Verbesserung der Genauigkeit, Farbwiedergabe, Kontraste, Beleuchtung und Schatten beiträgt. Man darf also gespannt sein.

Stable Diffusion XL in der Version 1.0

Interessante Betafunktion angekündigt

Als weiteres Highlight ist die baldige Einführung einer bisher nur Entwicklern zugänglichen Beta-Funktion angekündigt. Sie soll es den Benutzern erlauben, mit nur wenigen Bildern spezifische Generierungen auf bestimmte Personen, Produkte und anderes vorzunehmen. Damit ließen sich dann auch aus einfachen Produktfotos vor weißem Hintergrund mit minimalem Aufwand Werbekampagnen erzeugen. Oder Mitarbeiterporträts aus deren Selfies generieren.

Stable Diffusion XL in der Version 1.0
Zeig mehr

Christoph Künne

Christoph Künne ist Mitbegründer, Chefredakteur und Verleger der DOCMA. Der studierte Kulturwissenschaftler fotografiert leidenschaftlich gerne Porträts und arbeitet seit 1991 mit Photoshop.

10 Kommentare

  1. … gerade 680. DOCMAtische Depesche angezeigt bekommen. Ich bin nur noch entsetzt. So was auch nur im entferntesten als »Bild« zu bezeichnen grenzt … das fehlen mir die Worte. Das ist rein NICHTs. Das ist – sorry – MIST, sonst nichts. Sowas hier zu lesen/sehen, tut weh. Sehr sogar. Das verändert den allgemeinen Geschmack nachhaltig (über Instagram und deren Steuerungs-Algorithmen) brauchen wir ab hier nicht mehr zu diskutieren.
    Mensch, hat DOCMA keine anderen Themen? Seht ihr nicht, in was für eine optische Falle wir hineinlaufen, wenn man sowas noch medial positiv begleitet. Ich verstehe es wirklich nicht. Das hat mit »Photographie« (ja mit »Ph« geschrieben, hängt am Begriff »Photonen«) rein nichts mehr tun.
    Ich höre hier auf … ich möchte noch einen Rest an Höflichkeit bewahren.

    1. Warum willst Du eigentlich den Boten hängen?

      Ich bin auch kein Freund der AI, aber die DOCMA ist ein Magazin welches sich mit künstlichen Bilder befasst! Denn auch Photo Shop ist schon eine künstliche Realität.
      Sich einer neuen Situation zu verschließen, wird diese nicht ändern. Und auch wenn ich selbst noch nicht ein einziges AI Bild habe erzeugen lassen, bin ich ganz froh, dass ich doch über die DOCMA trotzdem auf dem aktuellen Stand der Technik gehalten werde.

      Das wir mit der AI in einen Visuellen-Inzest laufen und es mit Rechte Verletzung in unbekannter größe zu tun bekommen, sehe ich genau so.
      Aber es wird diese Technik nicht verschwinden lassen.

    2. Ich selbst bin auch noch skeptisch abwartend, was die veränderten Bilder mit unserer Sichtweise der Dinge macht, aber solche Pauschalisierungen kann ich nicht teilen.
      Ihr Text konnte vor 20 Jahren in ähnlicher Weise in Bezug auf die Digitalfotografie gelesen werden. Was wurde damals aller für „Verteufelungen“ in Bezug auf die Pixel-Bilder ausgesprochen …
      Mit solchen Medien ist es wie mit Beton: Es kommt darauf an, was man daraus macht!

    3. Danke für Deine Antwort. Du sprichst mir wortwörtlich aus der Seele. Habe es mir schon mindestens ein Dutzendmal verkniffen ebenfalls einen solchen Kommentar zu schreiben.
      Bin ausgebildeter Fotograf und habe 35 Jahre in diesem Beruf gearbeitet. Seit März dieses Jahres bin ich GLÜCKLICHERWEISE im Vorruhestand. Machen wir uns nichts vor, es wird kein Aufhalten und auch kein Weg zurück geben. Wo Geld verdient werden kann, wird es auch wahrgenommen. Man DOCMA dafür noch nicht mal einen Vorwurf machen. Man kann, als Leser dann nur die Konsequenz ziehen und das Lesen einstellen. Da mache ich schon sukzessiv für einzelne Berichte.

      1. @Fernando Baptista … volle Zustimmung zu Ihrem Post.
        Nur diese Ergänzung: es geht garnicht mal um Vorwürfe an DOCMA, sondern um Auseinandersetzung in der Sache und Klärung von Fragen. Diese neuen Technologie ist revolutionär und nicht mehr aufzuhalten, – im Guten wie im Schlechten. Aber sich dem quasi blind und »gläubig« ausliefern heißt sich selbst intellektuell zu entmündigen? Wenn jede kritische Meinungsäußerung gleich als »reflexhaften Abwehrstellung« verstanden wird, dann brauchen wir nicht mehr in der Sache zu streiten. Dann hat sich nicht nur diese, sondern jede Debatte erledigt. Dann sind wir Leser von Bilderzeugnissen nur noch zu einem passiven Konsum verdonnert und müßten im Zweifel noch die »Echtheitsprüfung« selbst übernehmen. Spätestens hier ist der Satz vom »Boten hängen etc.« eben falsch, denn dann kann jedes Medium, jede Redaktion Bilder publizieren und immer sagen: »sorry, – ich bin doch nur der Bote – aber nicht verantwortlich«. Und ich füge hinzu: für die Folgen nicht verantwortlich. Wohin das führen könnte, kann man sich an zehn Fingern abzählen …

    4. Zum Thema „wenn man sowas noch medial positiv begleitet“: In DOCMA jubeln wir nichts unkritisch hoch – auch die generative KI nicht. Aber wir stecken auch nicht den Kopf in den Sand und ignorieren die aktuellen Entwicklungen, oder begeben uns gar in eine reflexhafte Abwehrstellung. Über KI-Systeme schreiben wir ebenso kritisch wie über andere Themen; wir zeigen deren aktuell (und teilweise wohl auch noch in der absehbaren Zukunft) vorhandenen Schwächen auf und erklären, wodurch sie bedingt sind. Aber wir führen auch vor, wie man sie zu kreativen Zwecken nutzbar macht. Und wir bringen immer wieder Beiträge zur allgemeinen Debatte, welche Gefahren die KI für die Branche der Fotografen und Bildbearbeiter, aber auch für die Gesellschaft insgesamt birgt – neben den Chancen, die sie verspricht. Wie immer man diese Entwicklungen persönlich einschätzt: Nur wer sich darüber informiert, wird nicht unter die Räder geraten, sondern auf diesen ins Ziel rollen.

      1. @ M. Hußmann … wir kennen uns und ich schätze Sie. Aber mich dahingehend falsch zu verstehen, als sei ich in Toto gegen KI, ist unterkomplex. Ich bleibe aber dabei, daß ich die Bilder in dem o.g Artikel scheußlich finde. Und sie wären auch scheußlich, wenn sie analog auf Film erstellt worden wären.
        Ich verwahre mich ausdrücklich und vehement auch gegen den Vorwurf einer »reflexhaften Abwehrstellung«. Die Mängel und Nachteile einer KI im Bereich der Photographie zu nennen und zu diskutieren, ist noch keine »reflexhaften Abwehrstellung« (KI kann in anderen Bereichen durchaus ein Gewinn sein). – Ich sehe durchweg zuwenig journalistische Distanz, – nicht nur hier, sondern auch anderswo. Wenn ich mehrheitlich nur etwas zu den »Möglichkeiten« der KI lese, könnte ich auch die Pressemitteilungen von Anbietern aneinanderreihen. Dafür brauche ich keine intelligente Journalisten. – Und gefühlt (subjektiv!) ist für mich DOCMA in den letzten Monaten fast ausschließlich mit den Themen »KI« und »Vintage Objektive« unterwegs…
        Was ist denn z.B. mit dem »Ergänzen« von Bildteilen zu einem bestehenden Bild? ( z.B. YouTube > https://www.youtube.com/watch?v=oMozT-45X2Y&ab_channel=EdVerosky … ab ca. 0.45 min). Ergänzung? Ein euphemistischer Begriff für »Hinzudichten«, man könnte auch sagen »erfinden«, »faken« oder in deutscher Klarheit: lügen! Das hat rein nichts mit Kunst oder Photographie zu tun. Das ist Fälschung übelster Art. Die Möglichkeiten der KI auszudeuten in Richtung »wie-auch-immer-künstlerisches-Etwas-und-Weiterentwicklung-der-Photographie« ist Schwurbelei, sonst nichts und gehört angesprochen.
        Und was ist z.B. mit dem Thema der Kennzeichnung von KI-generierten oder »ergänzten« Bildern? Wo ist das Bemühen hier Standards zu setzen? Schon alleine für das Publikum, damit es weiß, wie das Bild entstanden ist. Das wäre Aufgabe einer kritischen Begleitung zum Thema. Ich verweise hier auf > https://www.youtube.com/watch?v=JQjH1f3QIqM. – Und ja, die »suchen« auch noch und haben noch nicht alle Probleme in Perfektion gelöst.

        Schlußbemerkung: dieser Text ist ohne KI-Tools verfaßt. Grins.

  2. Das gejammer um die Weiterentwicklung der Fotografie gibt es seit sie erfunden wurde. Die digitale Fotografie wurde
    seinerzeit genauso als zerstörerisches Instrument der wahren, echten Fotografie bezeichnet. Die Zeit hat anderes gezeigt und auch als Vorpensionist kann man sich neue Techniken anschauen, man muss sie ja nicht verwenden. Ich finde es sehr gut und dem Thema des Magazines entsprechend sogar wichtig, am Laufenden zu bleiben. Ich lese euer Magazin seit der ersten Ausgabe mit großer Freude und es sind genaus so viele Artikel drinnen die mich sehr interessieren, wie Artikel die meine Themen nicht so treffen.

Schreiben Sie einen Kommentar

Bitte melden Sie sich an, um einen Kommentar zu schreiben.

Back to top button