NVIDIA und Black Forest Labs: FLUX.1 Kontext [dev] vereinfacht Bildbearbeitung mit KI und RTX

Johannes Wilwerding4. Juli 2025

2 Minuten Lesezeit

Black Forest Labs hat erst im Mai die FLUX.1 Ko n text-Familie von Bildmodellen vorgestellt, die sowohl die Bildgenerierung durch Textanweisungen als auch die Modifikation vorhandener Bilder beherrschen. Sie akzeptieren also sowohl Text- als auch Bildprompts. Gemeinsam mit NVIDIA wurde inzwischen eines dieser Modelle, FLUX.1 Kontext [dev], für NVIDIA RTX GPUs optimiert. Die Integration von TensorRT – einer Softwarebibliothek zur Beschleunigung von KI-Anwendungen – sorgt dafür, dass die Bildbearbeitung auf RTX-Systemen bis zu doppelt so schnell abläuft wie bisher. Gleichzeitig wird weniger VRAM (Video Random Access Memory) der Grafikkarte beansprucht. Dadurch lassen sich auch auf leistungsfähigen, aber bezahlbaren Workstations komplexe Bildänderungen in Echtzeit durchführen.

Drei nebeneinander liegende Bilder derselben Grafik mit Kaffee und Snacks auf einem Tisch mit Blumen, die ein Beispiel für die mit dem FLUX.1 Kontext [dev]-Modell mögliche Bearbeitung in mehreren Schritten zeigen. Das Originalbild (links); die erste Bearbeitung verwandelt es in ein Bild im Bauhaus-Stil (Mitte) und die zweite Bearbeitung ändert den Farbstil des Bildes in Pastellfarben (rechts).

Intuitive Bedienung, schnelle Ergebnisse

FLUX.1 Kontext [dev] soll den kreativen Prozess vereinfachen. Die Bedienung erinnert an einen digitalen Skizzenblock, der auf Sprache hört. Wer beispielsweise ein Porträt aufhellen, den Hintergrund austauschen oder den Stil eines Referenzbilds auf eine neue Szene übertragen möchte, beschreibt das gewünschte Ergebnis einfach in Alltagssprache. Das Modell setzt die Vorgaben um, ohne dass eine Feinabstimmung oder tiefgehende Vorkenntnisse nötig sind. Einzelne Bildelemente lassen sich gezielt anpassen, ohne das gesamte Bild zu verändern – etwa indem ein Hut aufgesetzt oder die Farbe eines Pullovers geändert wird.

Zugänglichkeit und Integration

Das Modell steht auf der Plattform Hugging Face in zwei Varianten bereit: als Torch-Version für klassische KI-Workflows und als TensorRT-optimierte Version für maximale Geschwindigkeit auf RTX-Grafikkarten. Wer FLUX.1 Kontext [dev] ausprobieren möchte, kann das Modell direkt in ComfyUI – einer beliebten Open-Source-Oberfläche für KI-Bildbearbeitung – verwenden. Black Forest Labs bietet außerdem einen Online-Spielplatz an, auf dem sich das Modell ohne Installation testen lässt. Für Entwickler ist eine Microservice-Version (NIM) angekündigt, die ab August verfügbar sein soll. NVIDIA arbeitet zudem an Beispielcode, um die Integration in bestehende Arbeitsabläufe zu erleichtern.

Weitere Entwicklungen: Unterstützung für Google Gemma 3n

NVIDIA kündigt außerdem die Unterstützung für das multimodale KI-Modell Gemma 3n von Google auf RTX- und Jetson-Systemen an. Im Rahmen des Project G-Assist Plug-In Hackathons können Entwickler bis zum 16. Juli Plug-ins für dieses System entwickeln. Ein begleitendes Webinar findet am 9. Juli von 19:00 bis 20:00 Uhr MESZ statt. Dort werden die Grundlagen von Project G-Assist vorgestellt und Fragen beantwortet.

Mehr dazu lesen Sie im NVIDIA-Blog.

Johannes Wilwerding4. Juli 2025

2 Minuten Lesezeit

Michael J. Hußmann
Vimeo gibt es seit 21 Jahren, womit es sogar ein Jahr älter...
Christoph Künne
Vimeo ist ein Dienst wie YouTube. Das Video kann man ohne An...
heidi0908
Wer ist "Vimeo" ? Muss ich mich jetzt echt dermaßen verifizi...
Theo65
Ein Vergleich der hinkt, ist immer noch besser als einer, de...
Christoph Künne
Wenn Sie die Grafik etwas genauer betrachten, sehen Sie, das...
Philipp 93
Ich kann Ihre Haltung in diesem Artikel nicht ganz nachvollz...
Josef GLASER
Der Journalismus als System zur Informationsproduktion ist v...
Jürgen Grill
100% RICHTIG!...
Friedrich Poyer
Sehr guter Artikel. Danke. Spricht mir aus der Seele!...
mindthegap
scheint eine ewige Diskussion über die "Echtheit" eines Bild...

Intuitive Bedienung, schnelle Ergebnisse

Zugänglichkeit und Integration

Weitere Entwicklungen: Unterstützung für Google Gemma 3n

Johannes Wilwerding

Schreibe einen Kommentar Antwort abbrechen