Tencent hat ein KI-System vorgestellt, das 3D-Welten mit nur einem Bild generiert und die Produktionszeiten verkürzt.
In Kürze
- Generierung von 3D-Welten aus einem einzigen Bild
- World Cache für stabile Kamerafahrten und weniger Speicherbedarf
- Öffentlicher Code und vielseitige Einsatzmöglichkeiten
Tencent stellt neues KI-System „HunyuanWorld-Voyager“ vor
Tencent hat mit „HunyuanWorld-Voyager“ ein neues KI-System vorgestellt, das die Art und Weise, wie wir 3D-Welten erschaffen, auf den Kopf stellen könnte. Das Besondere daran? Es benötigt nur ein einziges Bild, um eine konsistente 3D-Welt zu generieren. Dabei greift das System auf RGB- und Tiefeninformationen zurück, um realistische 3D-Szenen zu kreieren, ohne dass dafür komplexe Modelle nötig sind.
Besondere Merkmale von „Voyager“
Ein Highlight von „Voyager“ ist der sogenannte „World Cache“. Dieser speichert Bildinformationen und nutzt sie bei Bewegungen wieder, was nicht nur Speicherplatz spart, sondern auch stabilere Kamerafahrten ermöglicht. Das klingt nicht nur clever, sondern könnte auch die Produktionszeiten erheblich verkürzen.
Leistungsfähigkeit und Vielseitigkeit
In Benchmarks schneidet das System besonders gut ab, vor allem in den Bereichen Kamerasteuerung und räumliche Konsistenz. Das bedeutet, dass „Voyager“ in der Lage ist, direkt 3D-Rekonstruktionen zu erstellen, was Nachbearbeitungsfehler minimiert und die Qualität der Ergebnisse steigert. Darüber hinaus ist das System vielseitig einsetzbar:
- Erstellung von 3D-Objekten
- Analyse der Tiefenstruktur von Videos
Die Möglichkeiten sind vielfältig. Der Code ist zudem öffentlich zugänglich und benötigt für eine 540p-Auflösung etwa 60 GB GPU-RAM.
Integration mit „HunyuanWorld 1.0“
„Voyager“ ergänzt das bereits veröffentlichte „HunyuanWorld 1.0“ und bringt einige Verbesserungen mit sich. Es ermöglicht längere und stabilere Kamerafahrten und löst Probleme mit verdeckten Bereichen, die in der 3D-Produktion oft auftreten. Während „Voyager“ sich auf die Produktion und 3D-Pipelines konzentriert, setzen andere Systeme wie Google Genie 3 auf interaktive Echtzeitwelten.
Zukunft der 3D-Weltgestaltung
Mit diesen Entwicklungen zeigt Tencent, dass die Grenzen der 3D-Weltgestaltung immer weiter verschoben werden.
Quellen
- Quelle: Tencent
- Der ursprüngliche Artikel wurde hier veröffentlicht
- Dieser Artikel wurde im Podcast KI-Briefing-Daily behandelt. Die Folge kannst du hier anhören.




