Meta verfolgt innovative Ansätze in der KI-Forschung und zeigt, wie KI durch Videos physikalische Konzepte erlernen kann.
In Kürze
- Neue Methode: Video Joint Embedding Predictive Architecture (V-JEPA)
- KI zeigt Verständnis für physikalische Gesetze in Tests
- Meta strebt Alternativen zu bestehenden generativen Modellen an
Meta’s Neue Ansätze in der KI-Forschung
Meta verfolgt neue Ansätze in der KI-Forschung und hat eine interessante Methode entwickelt, die es Künstlicher Intelligenz ermöglicht, physikalische Gesetze durch das Ansehen von Videos zu erlernen – ähnlich, wie Menschen es intuitiv tun. Anstelle der gängigen generativen KI-Modelle, die häufig auf detaillierte Pixel-Vorhersagen setzen, nutzt das Forscherteam die Video Joint Embedding Predictive Architecture (V-JEPA). Diese Technik erlaubt es der KI, übergeordnete Konzepte zu erfassen, anstatt sich nur mit einzelnen Pixeln zu beschäftigen. Dies könnte man mit der Funktionsweise des menschlichen Gehirns vergleichen, das die Welt um sich herum versteht.
Überprüfung der Fähigkeiten der KI
Um die Fähigkeiten dieser KI zu überprüfen, wurde das „Violation-of-Expectation„-Paradigma eingesetzt. Dabei wurden der KI Szenen präsentiert, in denen physikalische Gesetze auf die Probe gestellt wurden – beispielsweise ein Ball, der durch eine Wand rollt. Die zentrale Frage war: Versteht die KI die Physik hinter diesen Szenen? Die Ergebnisse waren vielversprechend: In Tests mit drei verschiedenen Datensätzen zeigte die KI ein gutes Verständnis für Konzepte wie Objektpermanenz und räumliche Kontinuität. Bemerkenswert ist, dass bereits 128 Stunden Videomaterial ausreichten, um diese Erkenntnisse zu gewinnen.
Metas Vision für die Zukunft der KI
Die Forscher bei Meta sind der Ansicht, dass KI-Systeme kein vorprogrammiertes „Kernwissen“ benötigen. Vielmehr können sie durch Beobachtung lernen, ähnlich wie es bei menschlichen Säuglingen der Fall ist. Diese Forschung ist Teil von Metas größerem Ziel, eine Alternative zu bestehenden generativen Modellen wie GPT-4o zu entwickeln. Meta-KI-Chef Yann LeCun betrachtet die herkömmlichen Modelle als „Sackgasse“ und setzt stattdessen auf die JEPA-Architektur, um KI-Systemen zu helfen, ein tieferes Verständnis der Welt zu erlangen.
Es bleibt abzuwarten, wie sich diese Entwicklungen in der KI-Forschung weiter entfalten werden.
Quellen
- Quelle: Meta
- Der ursprüngliche Artikel wurde hier veröffentlicht
- Dieser Artikel wurde im Podcast KI-Briefing-Daily behandelt. Die Folge kannst du hier anhören.