Blog

Neues aus der KI-Wundertüte (Teil 2)

Heute möchte ich Ihnen weitere Beispiele einer (demnächst) mehr oder weniger praktisch einsetzbarer künstlichen Intelligenz vorstellen.

„Jede hinreichend fortschrittliche Technologie ist von Magie nicht zu unterscheiden.“ Woher diese Aussage stammt, haben Sie an dieser Stelle vorletzte Woche erfahren (Neues aus der KI-Wundertüte: Bildbearbeitungs-Magie (Einführung und Teil 1)).

© Olaf Giermann. Neues aus der KI-Wundertüte (Teil 2)
© Olaf Giermann

RealityScan-App von Epic: iPhone-Fotos in hochauflösende 3D-Modelle konvertieren

Man benötigt mindestens 20 Fotos eines Objekts. Diese werden auf Epics Servern verarbeitet und zu einem 3D-Modell konvertiert. © Epic. Neues aus der KI-Wundertüte (Teil 2)
Man benötigt mindestens 20 Fotos eines Objekts. Diese werden auf Epics Servern verarbeitet und zu einem 3D-Modell konvertiert. © Epic

3D-Photogrammetry ist nichts Neues. Die haben wir schon vor Jahren im Heft vorgestellt und im App-Store gibt es Dutzende Apps, mit denen man aus Fotos oder durch Abfilmen 3D-Modelle erzeugen kann. Neu bei RealityScan ist die erzielbare Qualität der Ergebnisse. Leider habe ich es nicht mehr in die auf 10000 Teilnehmer beschränkte Open-Beta geschafft, sodass ich das nicht persönlich bestätigen kann. Aber die Vorschau sieht klasse aus:

Youtube:

Mehr Informationen (Englisch)

Diese App und Photogrammetrie haben nun noch nichts mit KI zu tun. Aber damit kommen wir schon zum nächsten Evolutionsschritt – NVidia Instant NeRF:

NVIDIA Instant NeRF: 3D-Modelle aus 2D-Foto(s) ableiten

Diese vier Fotos reichen aus, um ein frei drehbares 3D-Model der gezeigten Fotografin zu erzeugen. © NVidia. Neues aus der KI-Wundertüte (Teil 2)
Diese vier Fotos reichen aus, um ein frei drehbares 3D-Model der gezeigten Fotografin zu erzeugen. © NVidia

NeRFs nutzen neurale Netzwerke, um realistische 3D-Szenen aus einer Auswahl von 2D-Bildern abzuleiten. Anders als bei der Photogrammetry braucht man dabei nicht mehr Fotos von jeder Objektstelle, denn die KI ergänzt fehlende Bereiche. Hier das Ganze im Video:

Youtube:

Mehr Informationen (Englisch)

Frisur-Übertragung durch künstliche Int-Hair-ligenz 😉

Einzelne Haare für eine Freistellung zu malen, dürften die meisten von uns noch hinbekommen. Aber mal eben die Frisur vom Foto der einen Person auf ein Foto einer anderen Person zu übertragen? Die Barbershop-KI liefert schon beeindruckende Ergebnisse.

Im Paper wird gezeigt, wie die KI anhand verschiedener Input-Bilder trainiert wurde. Im Vergleich zu früheren Ergebnissen, sind die jetzigen deutlich realistischer. Neues aus der KI-Wundertüte (Teil 2)
Im Paper wird gezeigt, wie die KI anhand verschiedener Input-Bilder trainiert wurde. Im Vergleich zu früheren Ergebnissen, sind die jetzigen deutlich realistischer.

In diesem Video werden Funktionsweise und Möglichkeiten treffend und kompakt gezeigt und erklärt (Englisch):

Youtube:

Mehr Informationen (Englisch): Barbershop: Hair Transfer with GAN-Based Image Compositing Using Segmentation Masks

Spannend ist dieser digitale Friseursalon vor allem auch als Frisuren-Generator. Exaktes Freistellen kann dann schon einmal durch Umstylen mittels KI ersetzt werden.

Gebetsmaschine

© Diemut Strebe.
© Diemut Strebe

Zum Abschluss noch etwas Skurriles. „The Prayer” (deutsch „Das Gebet“) ist eine Kunstinstallation von Diemut Strebe, die sich zurzeit im Centre Pompidou in Paris befindet. Sie hat das Nötigste, was es für ein Gebet benötigt: Nase und Mund. Die an gregorianische Gesänge erinnernden Wortfetzen werden dabei durch eine KI generiert und rund um die Uhr rezitiert. Das klingt Gebeten täuschend ähnlich – wirkt aber natüüüüürlich nicht so gut echte Gebete™, denn das wäre ja Magie oder Blasphemie. 😉

Youtube:

Zeig mehr

Olaf Giermann

Sein Erstkontakt mit Photoshop erfolgte 2003 an der Uni, an der das Programm als reine Scanner-Software eingesetzt wurde. Inzwischen gilt Giermann sprichwörtlich als das »Photoshop-Lexikon« im deutschsprachigen Raum und teilt sein Wissen in DOCMA, in Video­kursen und in Seminaren.

Ähnliche Artikel

3 Kommentare

  1. Ab wann kann man denn von KI sprechen? Wenn die Asimov’schen Gesetze erfüllt werden. Das ist eine sehr einfache Definition, denn sie setzt ERKENNTNIS voraus. Akkes, was uns heute Marketingleute als KI verklickern, ist ein Marketingschmäh. Software, oder heutige Algorithmen, sind nicht intelligent. Sie können das, was ihnen mehr oder weniger intelligente Programmierer,die Algotithmen, die mehr oder weniger intelligente Informatiker und Mathematiker erdacht haben, abarbeiten. Normale Benutzer sind noch immer erstaunt, wie rasch Rechner aller Art ihre Aufgaben erledigen, doch nur weil ein Ergebnis herauskommt, das früher oder später eventuell auch Menschen erreicht hätten, sind weder Computer noch Programme intelligent.
    Also, bleiben wir endlich mal am Boden der Realität und lassen uns nicht vom Marketingleuten und anderen den Unsinn von KI einreden.
    Das mit der Magie ist ja ein alter Hut, von Medizinmännern, Religionen bis Jahrmarktgauklern haben ihr Geschäftsmodell darauf gegründet. Nur wird die Grenze der Magie immer weiter ausgedehnt. Eigentlich sollte Bildung dazu führen, dass man werten erlernt. Ist aber nicht so. Vielleicht gibt es in ferner Zukunft auf der Erde auch mal intelligente Lebewesen. Die Lebensdauer der Sonne könnte ja reichen.

    1. Asimovs Robotergesetze beschreiben nicht, was Künstliche Intelligenz ist, sondern wie sich eine Künstliche Intelligenz verhalten sollte, um für Menschen nützliche Funktionen zu erfüllen. Seit Alan Turing geht man üblicherweise von der Definition aus, dass KI die Leistung einer Maschine sei, die, wäre sie von einem Menschen erbracht worden, als intelligent gelten würde. Allerdings hat jemand mal bemerkt, dass das Forschungsgebiet der Künstlichen Intelligenz keine Erfolge erzielen könne, denn wann immer es gelänge, eine bestimmte menschliche Leistung von einer Maschine erbringen zu lassen, würde man sie nicht mehr als Beispiel für Intelligenz ansehen. Beispielsweise war man vor 70 Jahren allgemein der Meinung, dass Schachspiel auf Großmeisterniveau ein hohes Maß an Intelligenz voraussetze. Wenn es also gelänge, eine Maschine Schach auf diesem Niveau spielen zu lassen, hätte man das Geheimnis menschlicher Intelligenz geknackt. Heute besiegen Maschinen längst den amtierenden Schachweltmeister, aber niemand sieht darin noch ein Beispiel für eine überragende generelle Intelligenz.

      Wenn heute von KI die Rede ist, geht es meist nicht mehr um algorithmische Verfahren, die sich ein Softwareentwickler ausgedacht hätte, sondern um neuronale Netze, deren entscheidende Parameter mit Verfahren des maschinellen Lernens ermittelt werden. Wie die neuronalen Netze zu ihren Ergebnissen kommen, wird auch von ihren Entwicklern meist nicht vollständig verstanden, und das ist auch nicht zwingend notwendig. Herauszufinden, auf welche Weise ein solches KI-Verfahren zum Ziel führt, ist eine eigenständige Aufgabe, die zwar von wissenschaftlichem Interesse sein mag, aber wenn es um die Entwicklung von Anwendungssoftware geht, beschäftigt man sich nur damit, wenn etwas schief läuft – erst wenn man versteht, warum ein neuronales Netz in bestimmten Situationen falsche Ergebnisse liefert, weiß man, wie man ein Netz trainieren muss, um diese Fehler zu vermieden.

      Mit Erkenntnis hat das alles nichts zu tun. „Erkenntnis“ taugt aber auch kaum als Kriterium, weil man sich dazu erst einmal auf eine handhabbare Definition davon einigen müsste. Die KI-Forschung beschäftigt sich letztendlich auch nicht damit – die anwendungsorientierte Forschung sowieso nicht, aber auch die Grundlagenforschung tut das nur am Rande. Wenn es um die Überwindung bisheriger Fehlleistungen von KI-Systemen geht, ist auch weniger fehlende Erkenntnis die Herausforderung, sondern der schiere Umfang, also die Breite der allgemeinen menschlichen Intelligenz, der für bestimmte, eng begrenzte Aufgaben trainierte neuronale Netze wenig entgegenzusetzen haben.

      1. Es gibt keine Intelligenz ohne Erkenntnis. Wenn eine SW ein Objekt nicht als solches erkennt, ist sie nicht intelligent. Asimovs Robotergesetze setzen jedenfalls erkennen voraus, denn wer intelligent ist, kann Gegenstände und Lebewesen identifizieren. Und Asimovs Robotor können die Gesetze nur befolgen, weil sie Intelligenz haben. Diese paar Sätze von Asimov kann man keinem heutigen Computer geben, weil keiner sie verstehen kannn Das kann tatsächlich kein Algorithmus, keine Software und keine mathematische Beschreibung. Neuronale Netzwerke und SW die “lernt” sind Krücken, können durch derzeitige Rechenleistung vieles leisten, doch haben nichts mit Intelligenz zu tun. KI ist ein Marketingschmäh, weil eben jede Generation irgendetwas herausragend finden muss. Und so gerne glaubt.

Schreibe einen Kommentar

Schaltfläche "Zurück zum Anfang"