Ein neuartiges KI-System von Figure verändert die Steuerung humanoider Roboter durch Sprachverarbeitung und visuelle Erkennung.
In Kürze
- Helix kombiniert Sprachverarbeitung und Bewegungssteuerung in einem VLA-Modell.
- Roboter zeigen beeindruckende Flexibilität und Reaktionsfähigkeit in realen Szenarien.
- Figure beendet Partnerschaft mit OpenAI, bleibt aber als Investor aktiv.
Das Startup Figure und das neuartige KI-System Helix
Das Startup Figure hat mit Helix ein neuartiges KI-System entwickelt, das die Steuerung humanoider Roboter grundlegend verändert. Dieses System vereint Sprachverarbeitung, visuelle Erkennung und Bewegungssteuerung in einem sogenannten Vision-Language-Action (VLA) Modell.
Die Hauptkomponenten von Helix
Im Kern besteht Helix aus zwei Hauptkomponenten: einem umfangreichen Sprachmodell mit 7 Milliarden Parametern, das sowohl Sprache als auch visuelle Informationen verarbeitet und als das „Gehirn“ des Roboters fungiert. Ergänzt wird es durch ein weiteres Modell mit 80 Millionen Parametern, das die Befehle in präzise Bewegungen umsetzt.
Bewegungssteuerung und Demonstrationen
Mit beeindruckenden 35 Freiheitsgraden kann Helix die Bewegungen des Roboters steuern – von feinen Fingerbewegungen bis hin zu Kopf- und Rumpfbewegungen. In verschiedenen Demonstrationsvideos zeigt Figure, wie die Roboter auf Sprachbefehle reagieren, Objekte erkennen und sogar interagieren können. Besonders hervorzuheben ist die Fähigkeit der Roboter, auch in ungewohnten Situationen, wie beim Einsortieren von Lebensmitteln in einer Show-Küche, ohne spezielles Training zu agieren.
Effizientes Training und kommerzieller Einsatz
Das Training des Systems war vergleichsweise effizient: Mit nur 500 Stunden Daten hat Helix die nötigen Fähigkeiten erlernt. Zudem läuft das System auf eingebetteten Grafikprozessoren (GPUs) in den Robotern, die für die erforderliche Rechenleistung sorgen und somit einen kommerziellen Einsatz ermöglichen. CEO Brett Adcock sieht in Helix einen bedeutenden Fortschritt für den Einsatz von Robotern im Haushalt. Im Gegensatz zu früheren Systemen benötigt Helix keine aufwendige Umprogrammierung für neue Aufgaben und soll flexibel auf verschiedene Situationen reagieren können.
Zusammenarbeit mit OpenAI
Eine interessante Wendung gab es in der Zusammenarbeit mit OpenAI: Figure hat die Partnerschaft beendet, bleibt jedoch weiterhin als bedeutender Investor an Bord. Der Grund für diesen Schritt liegt darin, dass großflächige Sprachmodelle zunehmend zur Standardlösung werden. Figure konzentriert sich nun auf die Entwicklung neuer, leistungsfähiger KI-Modelle, die eine schnelle Steuerung von Robotern in der realen Welt ermöglichen – eine Herausforderung, die es in sich hat.
Quellen
- Quelle: Figure AI
- Der ursprüngliche Artikel wurde hier veröffentlicht
- Dieser Artikel wurde im Podcast KI-Briefing-Daily behandelt. Die Folge kannst du hier anhören.