Google erweitert die KI-Funktionen in der Photos App und hat damit begonnen, die generative KI Nano Banana (Gemini 2.5 Flash Image) zu integrieren. Zuerst kommen Nutzer in den USA an die Reihe. In einem Blog-Beitrag beschreibt das Unternehmen KI-basierte Neuerungen, mit denen Anwender in Kürze rechnen können. Neben sprachgesteuerter Bildbearbeitung zählen vorgefertigte Stil-Optionen und eine intelligente Bildsuche dazu.

Illustration: Google

Das Nano-Banana-Modell ermöglicht komplexe Bildtransformationen durch einfache Spracheingaben. Nutzer öffnen in der Photos App ein Foto, wählen den Bereich »Bearbeiten« und schreiben die gewünschte Veränderung in alltäglicher Sprache in das neue Eingabefeld »Beim Bearbeiten helfen«. Das System interpretiert Anweisungen wie „male mich als Renaissance-Porträt“ oder „gestalte das Bild als Mosaik aus bunten Kacheln“. Die Künstliche Intelligenz wendet die Änderungen automatisch an, ohne dass spezielle Werkzeuge ausgewählt werden müssen. Anweisungen nimmt die App auch per Spracheingabe entgegen (unter iOS zunächst nur in den USA).

Praktische Korrekturen und kreative Effekte

Nano Banana beherrscht nicht nur kreative Transformationen, sondern auch praktische Korrekturen. Fotografen können störende Elemente entfernen lassen, die Beleuchtung verbessern oder alte Aufnahmen restaurieren. Das Modell erkennt die Absicht hinter der Eingabe und setzt entsprechende Techniken ein.

KI-Vorlagen für beliebte Bearbeitungen

Im neu hinzugefügten Bereich »Create« bietet Google vorgefertigte Vorlagen für häufig nachgefragte Bearbeitungen. Beispiele sind „Setze mich in ein High-Fashion-Fotoshooting“ oder „Platziere mich auf einer winterlichen Grußkarte“. Der Bereich »Create« steht zunächst nur Android-Nutzern in den USA und Indien zur Verfügung.

In den kommenden Wochen will Google auch erste personalisierte Vorlagen in den USA einführen, die für Bearbeitungsvorschläge Erkenntnisse aus der persönlichen Fotogalerie nutzen – beispielsweise „eine Karikatur von mir und meinen Hobbys erstellen“.

Erweiterte Suchfunktion mit Gemini-KI

Die Suchfunktion »Ask Photos« nutzt das Gemini-KI-Modell für erweiterte Abfragen in natürlicher Sprache. Fotografen können detaillierte Fragen stellen und Anweisungen geben wie „schlage Fotos vor, die sich als Hintergrundbilder für das Telefon eignen“. Das System liefert relevante Ergebnisse aus der persönlichen Fotobibliothek. »Ask Photos« soll in dieser Woche in über 100 Ländern verfügbar sein. Zugänglich ist die neue Funktion über den »Ask«-Button zwischen »Bearbeiten« und »Hinzufügen«.

Transparenz durch IPTC-Kennzeichnung

Google kennzeichnet alle mit generativer KI bearbeiteten Bilder nach den Standards des International Press Telecommunications Council (IPTC). Diese Metadatensollen für Transparenz über den KI-Einsatz bei Bildmodifikationen sorgen.

Schrittweise Einführung der neuen Funktionen

Die Nano-Banana-Bearbeitung und KI-Vorlagen werden zunächst schrittweise für Android-Nutzer eingeführt. Ask Photos steht mehr Nutzern zur Verfügung, wobei Google Geschwindigkeit und Genauigkeit kontinuierlich verbessern will.

Weitere Informationen finden Sie im Google-Blog