Nvidia präsentiert DreamDojo: Offenes Weltmodell simuliert Roboter‑Handlungen

Was ein Weltmodell hier bedeutet

Stell dir ein neuronales Modell vor, das statt auf klassische 3D‑Engines oder manuell programmierte Physik zu setzen, direkt visuelle Folgen simuliert: Du gibst eine Aktion vor, und das System berechnet die nächsten Bild‑Frames, als ob ein Roboter die Handlung ausführen würde. Solche Vorhersagen erlauben, Handlungsfolgen zu testen, ohne echte Hardware zu beanspruchen.

Warum das relevant ist

Echtes Robotertraining ist oft langsam, teuer und mit Risiken verbunden — Verschleiß, Sicherheitsfragen, ständiges Zurücksetzen. DreamDojo bietet eine Alternative: Trainingsläufe finden in der Simulation statt, wodurch viele Iterationen möglich werden, ohne physischen Schaden oder aufwändige Laborbedingungen.

Wie DreamDojo arbeitet

Vortraining: Das Modell wurde mit rund 44.000 Stunden an Ego‑Perspektive‑Videos trainiert. Ego‑Perspektive heißt: First‑Person‑Aufnahmen aus der Sicht der handelnden Person.

Latente Aktionen: Bewegungen von Menschen werden in eine hardwareunabhängige Repräsentation übersetzt — sogenannte „latente Aktionen“. Diese interne Beschreibung menschlicher Bewegungen erlaubt dem Modell, aus menschlichem Verhalten zu lernen, bevor es je einen Roboter gesehen hat.

Feinabstimmung: Anschließend wird das vortrainierte Modell auf die spezifische Mechanik eines Zielroboters angepasst, damit die Simulation realistische Aktuator‑ und Kinematik‑Eigenschaften berücksichtigt.

Funktionen und Einsatzmöglichkeiten

DreamDojo erzeugt in Echtzeit simulierte Bildfolgen mit etwa 10 Bildern pro Sekunde. Das System erlaubt VR‑Fernsteuerung innerhalb der Simulation, die Bewertung von Roboterstrategien und vorausschauende Planung direkt im Weltmodell. So kannst du verschiedene Taktiken durchspielen und bewerten, ohne einen physischen Roboter zu riskieren.

Zugänglichkeit und technische Basis

Nvidia gibt an, dass Gewichte, Code und Daten offen verfügbar sind; weitere Details stehen auf der Projektseite und im zugehörigen Paper. Technisch baut DreamDojo auf Nvidia Cosmos auf. Quelle der Ankündigung ist Jim Fan via LinkedIn.

Quellen

Quelle: NVIDIA

Der ursprüngliche Artikel wurde hier veröffentlicht

Dieser Artikel wurde im Podcast KI-Briefing-Daily behandelt. Die Folge kannst du hier anhören.

Samsung holt Perplexity in Galaxy‑KI — ‚hey, Plex‘ startet die KI

Feb. 23, 2026 | Allgemein, KI

Samsung integriert Perplexity in Galaxy‑KI; Nutzer starten die KI per Sprachbefehl 'hey, Plex'.In KürzeStart per Stimme für Galaxy S26-NutzerPerplexity erhält Systemzugriff auf Samsung-Apps; Drittanbieter geplantTeil von Samsungs "Multi‑Agent‑Ökosystem"; Details beim...

ChatGPT Voice und Gemini geben falsche Aussagen als Audio wieder – Alexa+ bleibt stur

Feb. 23, 2026 | Allgemein, KI

NewsGuard-Test: ChatGPT Voice und Gemini sprachen teils realistische Falschinfos – Alexa+ lehnte alle ab.In KürzeGetestet: ChatGPT Voice, Gemini Live und Alexa+ mit 20 falschen BehauptungenChatGPT Voice 22% und Gemini 23% false Audioantworten; bei böswilligen...

Studie: Apple Intelligence reproduziert ethnische und Geschlechter‑Bias

Feb. 23, 2026 | Allgemein, KI

Studie: Apple‑Summaries auf iPhone/iPad/Mac zeigen Ethnie‑ und Gender‑Bias und fügen oft falsche Details hinzu.In KürzeAutomatisch angezeigte Zusammenfassungen betroffenWeißsein wird seltener genanntOffene Modelle halluzinieren weniger Apple Intelligence produziert...

Nvidia präsentiert DreamDojo: Offenes Weltmodell simuliert Roboter‑Handlungen

In Kürze

Was ein Weltmodell hier bedeutet

Warum das relevant ist

Wie DreamDojo arbeitet

Funktionen und Einsatzmöglichkeiten

Zugänglichkeit und technische Basis

💡Über das Projekt KI News Daily

Das könnte dich auch interessieren…

Samsung holt Perplexity in Galaxy‑KI — ‚hey, Plex‘ startet die KI

ChatGPT Voice und Gemini geben falsche Aussagen als Audio wieder – Alexa+ bleibt stur

Studie: Apple Intelligence reproduziert ethnische und Geschlechter‑Bias

Über uns

Dein Thema?

Pickert GmbH