Das KI-Start-up Poetiq hat mit seiner neuesten Technologie beim ARC-AGI-2 Benchmark beeindruckende Fortschritte erzielt.
In Kürze
- Poetiq erreicht 75% Genauigkeit im ARC-AGI-2 Benchmark
- Kein spezielles Training erforderlich für signifikante Verbesserungen
- KI-Systeme adaptieren in Echtzeit und lösen komplexe Aufgaben
Fortschritt von Poetiq im ARC-AGI-2 Benchmark
Das KI-Start-up Poetiq hat mit seiner neuesten Technologie einen beeindruckenden Fortschritt beim ARC-AGI-2 Benchmark erzielt. Dieser Test gilt als Maßstab für die Fähigkeit einer KI, abstrakt und adaptiv zu denken – also neue Fähigkeiten zu entwickeln, anstatt nur bestehende Daten wiederzugeben. Poetiqs System, das auf OpenAIs GPT-5.2 basiert, erreichte eine Genauigkeit von 75 Prozent. Zum Vergleich: Der Durchschnitt menschlicher Teilnehmer liegt bei 60 Prozent.
Besondere Merkmale von Poetiqs Ansatz
Besonders bemerkenswert ist, dass Poetiq für den ARC-Test kein spezielles Training benötigte und dennoch eine signifikante Verbesserung der Genauigkeit erzielte, während die Kosten pro Aufgabe niedriger blieben. Der Schlüssel zu diesem Erfolg liegt in einem speziellen Verfahren, bei dem die KI eigenständig Code zur Lösung von Aufgaben generiert, diesen ausführt und bei Bedarf selbstständig korrigiert.
Vergleich mit anderen KI-Modellen
Ein Blick auf andere KI-Modelle zeigt, dass auch sie ähnliche Fortschritte machen. Während frühere Tests oft zeigten, dass KIs an komplexen Aufgaben scheiterten, nutzen moderne Modelle mittlerweile ausgeklügelte Techniken, um diese Herausforderungen zu meistern. Das könnte darauf hindeuten, dass die ursprünglich hohe Hürde des ARC-Tests bereits überwunden ist.
Wandel in der Arbeitsweise von KIs
Die Ergebnisse der Benchmarks verdeutlichen einen Wandel in der Arbeitsweise von KIs: Anstatt sich ausschließlich auf vorab trainierte Daten zu stützen, sind sie nun in der Lage, in Echtzeit zu adaptieren. Mechanismen wie die Programmsynthese ermöglichen es ihnen, Aufgaben erfolgreich zu lösen. Dieser Wandel verschiebt den Fokus der Forschung zunehmend von umfangreichen Trainingsdaten hin zu effizienteren Anpassungsprozessen.
Zukunftspläne für den ARC-Test
In Zukunft planen die Entwickler hinter dem ARC-Test, neue und noch anspruchsvollere Tests zu entwickeln, um die „Handlungsfähigkeit“ von KI-Systemen genauer zu untersuchen.
Quellen
- Quelle: Poetiq
- Der ursprüngliche Artikel wurde hier veröffentlicht
- Dieser Artikel wurde im Podcast KI-Briefing-Daily behandelt. Die Folge kannst du hier anhören.




