RSS

Verpixeln bleibt sicher

Verpixeln bleibt sicher – oder? Lassen sich durch Verpixeln vermeintlich unkenntlich gemachte Bilddetails wiederherstellen? Eine aktuelle Veröffentlichung aus Googles Forschungslabor könnte diesen Eindruck erwecken, aber das wäre ein Missverständnis: Eine grobe Verpixelung bleibt sicher.

„Fotos verpixeln ist nicht mehr sicher“, so hieß es vor ein paar Tagen an dieser Stelle in einem Gastbeitrag von prophoto online. Sollte es tatsächlich möglich sein, durch Anwendung des »Mosaikeffekt« oder durch schlichtes Herunterrechnen der Auflösung vernichtete Bilddetails zu rekonstruieren? Das würde an Zauberei grenzen, denn die ursprünglich im Bild enthaltenen Informationen sind schließlich verloren. Zugegeben: Der Fachartikel „Pixel Recursive Super Resolution“ könnte bei oberflächlicher Lektüre so verstanden werden. Da dessen Autoren Ryan Dahl, Mohammad Norouzi und Jonathon Shlens aber nicht in Hogwarts, sondern in Googles Forschungslabor arbeiten, sind ihre Ergebnisse zwar durchaus bemerkenswert; Unmögliches versprechen sie jedoch weder, noch können sie es liefern.

Verpixeln bleibt sicher

Aus grob verpixelten Bildern (ganz links) kann ein neuronales Netz Bilder berechnen, die feine Details zeigen und den unverpixelten Originalbildern (ganz rechts) erstaunlich ähnlich sehen. Das bedeutet aber nicht, dass sich eine Verpixelung generell rückgängig machen ließe.

Nun ist es nicht so weit hergeholt, an der Sicherheit vermeintlich anonymisierter Bilder zu zweifeln. Vor einigen Jahren ging der Fall eines Kanadiers durch alle Medien, der wegen des sexuellen Missbrauchs von Kindern dingfest gemacht werden konnte. Er hatte sein Gesicht in Fotos, die ihn zusammen mit den Kindern zeigten, zwar durch Anwendung des »Strudel«-Filters in Photoshop unkenntlich gemacht, doch fanden die Ermittler bei Interpol nach drei Jahren heraus, dass sich die Wirkung des Filters durch dessen erneute Anwendung mit umgekehrtem Vorzeichen fast vollständig rückgängig machen lässt (Doc Baumann hätte ihnen das gleich sagen können …).

Verpixeln bleibt sicher

Die mit dem Filter »Strudel« verwischten Details lassen sich durch eine erneute Filteranwendung mit umgekehrtem Vorzeichen rückgängig machen – links das Original, in der Mitte das Ergebnis des Filters und rechts die lediglich etwas unschärfere Rekonstruktion.

Während der »Strudel« die Pixel aber nur verschiebt, so dass sie sich an ihre alte Position zurück schieben lassen, fasst der »Mosaikeffekt« jeweils eine Vielzahl von Pixeln zusammen und ersetzt sie durch Pixel in deren Durchschnittsfarbe. Die Unterschiede zwischen den Pixeln sind im Ergebnis nicht mehr enthalten, und da Tausende von Bildern nach der Verpixelung identisch aussehen, kann man das unverpixelte Original nicht mehr rekonstruieren. Das von den Google-Forschern entwickelte Super-Resolution-Verfahren auf Basis neuronaler Netze versucht das auch gar nicht; das Ziel der Wissenschaftler ist ein ganz anderes.

Ihnen geht es darum, fehlende Bildinformationen so zu ergänzen, dass sie einem Betrachter natürlich erscheinen. Man kann das mit dem inhaltsbasierten Löschen in Photoshop vergleichen, das eine Fläche auf Basis einer Analyse der Umgebung mit vermutlich passenden Details auffüllt. Nachdem wir fehlende Bildteile auf diese Weise ergänzt haben, wird das Ergebnis meist nicht dem entsprechen, was sich tatsächlich dort befand, aber für viele Zwecke reicht es schon, wenn das Bild stimmig erscheint. Das Super-Resolution-Verfahren von Dahl, Norouzi und Shlens soll ebenfalls Bildteile ergänzen, nur handelt es sich in diesem Fall um feine Details, wie sie für eine Auflösungsvergrößerung benötigt werden.

Wenn wir ein Bild beispielsweise auf die vierfache Pixelzahl skalieren, muss jedes Ursprungspixel durch 2 mal 2 neue Pixel ersetzt werden. Gängige Verfahren wie die bikubische Interpolation vermeiden zwar Pixeltreppen, erzeugen aber verschwommene Strukturen; das Bild wirkt leicht unscharf und enthält nicht mehr Details als das Originalbild. Eine Alternative wäre, feine Details passend zu erfinden, um der höheren Pixelzahl gerecht zu werden. Diese Idee ist nicht neu, denn schon vor rund 15 Jahren gab es Skalierungsverfahren auf Basis einer fraktalen Kompression, mit denen man die Auflösung eines Bildes scheinbar verbessern konnte. Aufgrund einer vermuteten „Selbstähnlichkeit“ des Bildes, also ähnlichen Formen in groben wie feinen Strukturen, erfindet eine fraktale Skalierung vermutlich passende Details. Ob die Resultate überzeugen, hängt davon ab, ob es die vorausgesetzte Selbstähnlichkeit tatsächlich gibt.

Das neue Super-Resolution-Verfahren arbeitet dagegen wissensbasiert: Wenn ein neuronales Netz beispielsweise durch das Training mit einer großen Zahl von Porträtbildern gelernt hat, wie menschliche Gesichter aussehen, kann es zu grob verpixelten Porträts passende Details hinzufügen. Konkret haben Dahl, Norouzi und Shlens das von ihnen entwickelte neuronale Netz einmal mit einer Sammlung von Porträts diverser Celebrities und in einem zweiten Test mit Fotos von Schlafzimmern trainiert. Die Besonderheit ihres Verfahrens ist, dass es einzelne Details nicht unabhängig, sondern aufeinander abgestimmt ergänzt, was die Qualität der Ergebnisse verbessert. Das Ziel der Wissenschaftler war nicht, die unverpixelten Originalbilder wiederherzustellen, sondern Bilder zu erhalten, die nicht von einem echten Foto zu unterscheiden sind. Diesem Ziel sind sie – zumindest unter günstigen Randbedingungen – recht nahe gekommen.

Was könnten wir mit einem solchen Verfahren anfangen, wenn es denn irgendwann einmal marktreif wäre? Stellen Sie sich vor, Sie wären bei einem Fußballspiel und würden die gegenüberliegende Tribüne des Stadions fotografieren. Von den Gesichtern der Zuschauer würden in Ihrem Foto jeweils nur ein paar Pixel bleiben, so dass Sie niemanden erkennen könnten. Eine Vergrößerung des Bildes mit dem beschriebenen Super-Resolution-Verfahren würde detaillierte Gesichter ergänzen, nur hätten diese keine besondere Ähnlichkeit mit den Zuschauern, die tatsächlich im Stadion waren, sondern sähen eher wie die Gesichter der Prominenten aus, mit denen das neuronale Netz trainiert worden ist.

Verpixeln bleibt sicher: Von der Marktreife ist das Verfahren weit entfernt

Von der Marktreife ist das Verfahren ohnehin noch weit entfernt. Der generelle Nachteil wissensbasierter Verfahren ist, dass man für jeden Gegenstandsbereich jeweils eine neue Lösung braucht. Dahl, Norouzi und Shlens haben ihr Verfahren beispielhaft auf Porträts und Schlafzimmerfotos angewandt, aber eine universell einsatzbare Lösung braucht Verfahren, die mit allen denkbaren Motiven funktionieren. Zudem müsste ein Bild erst einmal daraufhin analysiert werden, was für Motive darin enthalten sind und welche Verfahren sich jeweils am besten darauf anwenden lassen.

Verpixeln bleibt sicher

Die Anwendung des Super-Resolution-Verfahren auf verpixelte Ansichten von Schlafzimmern produziert, anders als seine Anwendung auf Gesichter, keine so verblüffende Ähnlichkeit mit den Originalen.

Wie kommt es nun aber, dass die aus verpixelten Bildern berechneten Ergebnisse den Originalen so ähnlich sehen? Dies hat zwei Gründe. Zum einen haben die Forscher dieselben Bilder für das Training des neuronalen Netzes wie für den späteren Test verwendet. Die Pixelbilder enthalten zwar nur noch wenige Informationen, aber Informationen über die Originalbilder verbergen sich im neuronalen Netz und können eben deshalb wiederhergestellt werden. Verpixelte Versionen anderer, nicht bereits zum Training verwendeter Porträts hätten zu anderen Ergebnissen geführt. Der zweite Grund besteht darin, dass menschliche Gesichter eine immer gleiche Grundstruktur haben – es gibt zwei Augen, eine Nase und einen Mund, deren Lage zueinander weitgehend vorgegeben ist. Beim zweiten Testbeispiel, den Ansichten von Schlafzimmern, gibt es eine viel größere Bandbreite: Man kann davon ausgehen, dass irgendwo im Bild ein Bett zu sehen sein wird, aber die übrige Ausstattung und die Lage von Fenstern und Türen variieren stark. Daher produziert das Verfahren oft andere Details, als sie das Originalbild zeigte. Die Ergebnisse sehen zwar immer noch schlafzimmerähnlich aus, aber nicht unbedingt wie das Schlafzimmerbild, das verpixelt worden war. Und natürlich gilt auch für dieses Anwendungsbeispiel, dass die Ergebnisse anders ausgefallen wären, wenn man mit anderen, nicht bereits im Training genutzten Bildern getestet hätte.

Eine hinreichend grobe Verpixelung von Gesichtern bleibt also sicher. Im besten Fall kann ein neuronales Netz ein Gesicht so perfekt ergänzen, dass man das Ergebnis für ein echtes Foto hält, aber es wäre nicht das ursprünglich verpixelte Gesicht.

Michael J. Hußmann

Related Posts

Mitdiskutieren