Blog

Die (fotorealistische) Zukunft der Kommunikation?

Olaf Giermann8. Dezember 2023

2 Minuten Lesezeit

Vielleicht erinnern Sie sich noch an die Vorstellung der lächerlich-kruden Avatare für das Metaverse. Das genaue Gegenteil davon sind jetzt die von Metas Codec Avatars Lab vorgestellten „Relightable Gaussian Codec Avatars“. Diese Echtzeit-Repräsentationen von Gesichtern könnten nun tatsächlich die Zukunft der Kommunikation zeigen.

Was vorletztes Jahr im 90er-Jahre-Look begann, könnte schon bald für Jeden fotorealistisch aussehen. Die (fotorealistische) Zukunft der Kommunikation? — Was vorletztes Jahr im 90er-Jahre-Look begann, könnte schon bald für Jeden fotorealistisch aussehen.

Relightable Gaussian Codec Avatars = Telepräsenzen

Ein Running Gag bei Videokonferenzen ist, dass die Teilnehmer in Unterhosen teilnehmen und nur im für die Webcam sichtbaren Ausschnitt formelle Kleidung tragen. Für Telekonferenzen per Webcam muss man zwar nicht mehr aus dem Haus gehen, aber hübsch machen muss man sich doch noch ein wenig. Telepräsenzen, kurz: Avatare, würden das überflüssig machen – und auch ein von der Realität abweichendes Aussehen ermöglichen.

Das vom Meta-Konzern propagierte Meta-Verse würde Menschen aus aller Welt in einer virtuellen Umgebung zusammenbringen. Avatare wären dabei virtuelle schwebende Oberkörper als Repräsentationen der Teilnehmer. Was Meta und Chef Mark Zuckerberg als erste Variante präsentierten, wurde als völlig aus der Zeit gefallen belächelt und jeder fragte sich, was man damit wohl anfangen solle (mehr Informationen, Englisch).

© Meta Links die erste Variante eines Metaverse-Avatars, rechts eine verbesserte. Ernsthafte Kommunikation ist damit schwerlich denkbar. Die (fotorealistische) Zukunft der Kommunikation? — © Meta: Links die erste Variante eines Metaverse-Avatars, rechts eine verbesserte. Ernsthafte Kommunikation ist damit schwerlich denkbar.

Relightable Gaussian Codec Avatars

Heute bin ich über ein Forschungs-Paper des Codec Avatars Lab von Meta gestolpert (Link, Englisch), bei dem mir die Kinnlade herunterfiel, nachdem ich verstanden hatte, was ich dort sah.

Echtzeit generierte Avatare mit einzigartigen Ausdrückes, Blicken und Beleuchtungen mit Global Illumination und realistischen Reflexionen bis ins kleinste Detail. — In Echtzeit generierte Avatare mit einzigartigem Gesichtsausdruck und Blick. Beleuchtungen mit Global Illumination und realistischen Reflexionen bis ins kleinste Detail.

Was ich zunächst für die Referenzvideos echter Darsteller hielt, waren bereits die generierten Avatare. Sie müssen sich die Videos anschauen, um deren Wirkung beurteilen zu können. Man muss schon genau hinschauen, um die Unterschiede zu echtem Videomaterial zu sehen.

Gaussian Splatting – ohne 3D-Drahtgittermodell zu Relightable Gaussian Codec Avatars

Anders als früher musste hier kein aufwendiges 3D-Modell erzeugt werden, das dann texturiert, animiert und beleuchtet wird. Die hier verwendete „Gaussian Splatting“-Technik ähnelt den technisch verwandten „neural radiance fields“ (Nerfs), kann im Gegensatz zu diesen jedoch in Echtzeit berechnet werden. Stark vereinfacht handelt es sich um eine dreidimensionale Repräsentation einer Szene, die mit Deep-Learning-Algorithmen aus wenigen zweidimensionalen Fotos erzeugt wurde.

Ein Schema der angewandten Methode. Ja, es ist kompliziert. ;-). Die (fotorealistische) Zukunft der Kommunikation? — Ein Schema der angewandten Methode. Ja, es ist kompliziert. 😉

Statt eines (zeit-)aufwendigen und detaillierten 3D-Scans bedarf es so nur einiger Fotos für eine fotorealistische Telepräsenz. Und das ist natürlich spannend, da so jeder mit einem Smartphone in die Lage versetzt wird, einen solchen Avatar von sich zu erzeugen.

Im Hinblick auf die Verwendung von VR-Headsets wie der Meta-Quest ist natürlich auch die relativ geringe erforderliche Rechenleistung von Vorteil. Zusammen mit der Augen und Gesichtserkennung dieser Geräte kann die Mimik verzögerungsfrei auf den Avatar übertragen werden.

Unabhängige Parameter und hochpräzise Beleuchtung der Relightable Gaussian Codec Avatars

Das vorgestellte Gauß-Splatting erlaubt eine extrem realistische Beleuchtung der Avatare – selbst feinste Details wie einzelne Haarsträhnen und Poren werden realistisch wiedergegeben und reagieren auf wechselnde Lichtverhältnisse.

Gesichtsausdruck, Blick, Ausrichtung und Beleuchtung sind unabhängig voneinander steuerbar.

Drei verschiedene Parameter können Sie testweise auf https://shunsukesaito.github.io/rgca/einstellen. — Drei verschiedene Parameter können Sie testweise auf https://shunsukesaito.github.io/rgca/ einstellen.

Die Forscher demonstrieren die Machbarkeit ihres Ansatzes mit einem Standard-PC-VR-Headset aus verschiedenen Blickwinkeln, mit unterschiedlichen Beleuchtungsarten. Das folgende Video zeigt die für Kommunikation entwickelte Technologie in Aktion.

Weitere Informationen und Videos finden Sie auf der Website des Forschungsprojekts: https://shunsukesaito.github.io/rgca/

Im DOCMAshop finden Sie alle Infos zum aktuellen Heft: Das ausführliche Inhaltsverzeichnis, einige Seiten als Kostprobe sowie alle Möglichkeiten, das gedruckte Heft zu abonnieren. Erfahren Sie dort auch mehr über unsere preiswerten Online-Abos – jetzt ab 3,99 € pro Monat.

Schlagworte

Olaf Giermann8. Dezember 2023

2 Minuten Lesezeit

Zeig mehr

Michael J. Hußmann
Veränderungen, wie sie die Relight-Funktion unterstützen sol...
PeterRoskothen
LIeber Kollege, Was ist denn daran „kreativ“? Kreativität fi...
Michael J. Hußmann
Neben der Photo+Adventure in Duisburg bleiben in Deutschland...
objektivsubjektiv
Hallo Grundsätzlich finde ich es erfreulich, wenn es neue Ve...
Doc Baumann
Vielen Dank für Eure freundlichen Reaktionen Doc...

Die (fotorealistische) Zukunft der Kommunikation?

Relightable Gaussian Codec Avatars = Telepräsenzen

Relightable Gaussian Codec Avatars

Gaussian Splatting – ohne 3D-Drahtgittermodell zu Relightable Gaussian Codec Avatars

Unabhängige Parameter und hochpräzise Beleuchtung der Relightable Gaussian Codec Avatars

Olaf Giermann

Schreiben Sie einen Kommentar Antworten abbrechen

Das Buch: Die Geheimnisse perfekter Prompts

Kunst (besser) verstehen

Was will uns der Künstler damit sagen?

Alles so schön bunt hier

Acrobat AI Assistant – echtes Interview mit einem Buch dank KI?

Interview mit einem Buch: Nachtfotografie

Schwarzweiß-Fotografie

DOCMA Freistellen 2.0: Ebenenisolation und Transparenz-Modi

Zusatzmodule installieren

Verbesserte Freistell-Tools

Miniatureffekt

Vergleichsansicht in Lightroom

Retusche per Hilfsfoto

Eigene Bildgröße verwenden

Camera Raw auf dem iPad

Relightable Gaussian Codec Avatars = Telepräsenzen

Relightable Gaussian Codec Avatars

Gaussian Splatting – ohne 3D-Drahtgittermodell zu Relightable Gaussian Codec Avatars

Unabhängige Parameter und hochpräzise Beleuchtung der Relightable Gaussian Codec Avatars

Olaf Giermann

Ähnliche Artikel

Photon-Event – neuer Spirit für Fotoszene?

Auswirkungen von KI auf künstlerische Berufe

Kunst (besser) verstehen

Neurapix bietet jetzt individuellen Bildzuschnitt mit KI

Schreiben Sie einen Kommentar Antworten abbrechen