DOCMA Freistellen-Panel
DOCMA Artikel

Können Computer Bilder verstehen?

Welchen Nutzen können Bildbearbeiter und Fotografen aus Assistenzfunktionen ziehen, die auf künstlicher Intelligenz basieren? Kann ein neuronales Netz erkennen, was schön ist? Über diese Fragen haben wir mit zwei KI-Forschern aus Lübeck gesprochen. Lesen Sie hier einen Auszug aus dem Interview. Den vollständigen Artikel finden Sie in der neuen DOCMA-Ausgabe 86 (Januar/Februar 2019), die Sie im Docma-Shop bestellen oder als E-Paper kaufen können.

Von der künstlichen Intelligenz (KI) als Allheilmittel oder Bedrohung ist derzeit in allen Medien die Rede. Ob sie uns eher schadet oder nutzt, kann der Laie kaum beurteilen. Nachdem jüngst ein von einer KI erzeugtes Gemälde bei einer Versteigerung des Auktionshauses Christie’s 432500 Dollar erzielte, kann man sich fragen, ob die KI inzwischen bereits erkennen kann, was ein schö- nes von einem weniger schönen Bild unterscheidet.

Wir wollten mehr darüber erfahren und haben deshalb die KI-Experten Dr. Thomas Käster und Kai Röhr konsultiert. Käster ist Technikchef von PRC (www.prc-gmbh.de), einem Spin-off der Universität zu Lübeck. Kai Röhr ist als KI-Ingenieur in derselben Firma tätig. Künstliche Intelligenz, neuronale Netze und Deep Learning sind ihr täglich Brot, und sie sollten uns erklären, ob die KI ein so komplexes Konzept wie Ästhetik modellieren kann.

Christoph Künne (CK): Thomas, ich habe dir heute eine DVD mit 60000 Porträtfotos mitgebracht. Kann mir eure Excire-KI in Zukunft dabei helfen, die besten Bilder herauszusuchen?

Thomas Käster (TK): Im Prinzip sollte das gehen. Einige auf die Bewertung von Einzelbildern ausgerichtete Angebote gibt es ja schon länger im Internet. Man kann das vielleicht algorithmisch angehen, aber die Frage ist auch, wie man das am Ende verpackt, also wie man die Schnittstelle für den Benutzer gestaltet.

CK: Ästhetik ist ja immer kontextbezogen und sozialisationsbedingt. Das macht es kompliziert, weil verschiedene Leute unterschiedliche Dinge als schön ansehen, und das kann man nur schwer in Software abbilden. Auf der anderen Seite gibt es aufgrund von 2000 Jahren Kulturgeschichte im Westen gewisse Gemeinsamkeiten bei den Parametern dafür, was als schön empfunden wird.

TK: Ich bin gespannt, wie weit wir überhaupt kommen, so etwas generell zu definieren. Wir haben schon verschiedene Versuche unternommen, aber die Ergebnisse waren nicht wirklich überzeugend. Ich habe allerdings das Gefühl, dass die verwendeten Datensätze bisher ein Problem sind, weil es sich meist nicht um professionelle Aufnahmen handelt – die Qualität der Bilder ist einfach nicht so gut. Es wäre interessant zu sehen, ob eine Software die ästhetischen Unterschiede erkennen könnte, wenn man Fotos unterschiedlicher Qualität mischt. Wir werden auf jeden Fall mit verschiedenen Referenz-Datensätzen arbeiten. Schön wäre es, wenn man einen ausreichend großen Datensatz hätte, der allgemein anerkannt hervorragende Fotos enthält. Den haben wir leider nicht, aber dafür einen, der über eine halbe Million von Mitgliedern eines Internet-Foto­klubs bewertete Fotos umfasst. Das sollte schon mal eine gute Ausgangsbasis liefern, denn bei den meisten aktuell verwendeten KI-Verfahren handelt es sich um überwachtes Lernen. Das bedeutet, dass Daten und sogenannte Label vorliegen müssen, in unserem Ästhetik-Fall also Bilder und Bewertungen. Sobald wir damit ein Stück weiter sind, halten wir euch auf dem Laufenden.

CK: Gut, wir müssen also warten, bis ihr euer System mit diesen und anderen Daten trainiert habt, bevor wir wissen, ob das Ergebnis funktioniert. Auf welche Anwendungen richtet ihr denn aktu­ell euer Augenmerk?

TK: Für die meisten Kunden, die ja vor allem enthusiastische Hobbyfotografen sind, besteht ein wichtiges Problem schon darin, Bilder überhaupt wiederzufinden. Den Fotografen, der seine Bilder systematisch verschlagwortet, den gibt es ja kaum. Selbst unter den Profis nicht. Niemand außer ein paar sehr fleißigen und disziplinierten Fotografen hat Lust darauf, dafür stundenlang vor dem Rechner zu hocken, statt angenehmere oder einträglichere Dinge zu tun. Damit ist unsere große Aufgabe immer noch die Erkennung von Bildinhalten.


Lesen Sie die Fortsetzung des Interviews in der neuen DOCMA-Ausgabe 86 (Januar/Februar 2019)


Das DOCMA-Heft bekommen Sie im gut sortierten Zeitschriftenhandel, an Bahnhöfen und Flughäfen sowie bei uns im DOCMA-Shop. Dort (und nur dort) können Sie zwischen der ePaper-Ausgabe und dem gedruckten Heft wählen. Beides zusammen gibt es auch im Kombi-Abo.

Zeig mehr

Michael J. Hußmann

Michael J. Hußmann gilt als führender Experte für die Technik von Kameras und Objektiven im deutschsprachigen Raum. Er hat Informatik und Linguistik studiert und für einige Jahre als Wissenschaftler im Bereich der Künstlichen Intelligenz gearbeitet.

Ähnliche Artikel

Kommentar

  1. Man glaube nicht, dass in der Kunst die Schönheit wesentlich ist.
    Wie meinte doch eine renomierte Kunt-Einkäuferin: “Kunst ist, wenn ICH sage, es sei Kunst!”
    In dem Bereich mit Umsätzen von Millionen ist die Bewertung von Nichtetablierten wie KI unwesentlich 😉

Schreibe einen Kommentar

Back to top button
Close