Poetiq erzielt Rekord beim ARC-AGI-2 Benchmark – KI denkt adaptiv

26.12.2025 | Allgemein, KI

Das KI-Start-up Poetiq hat mit seiner neuesten Technologie beim ARC-AGI-2 Benchmark beeindruckende Fortschritte erzielt.

In Kürze

  • Poetiq erreicht 75% Genauigkeit im ARC-AGI-2 Benchmark
  • Kein spezielles Training erforderlich für signifikante Verbesserungen
  • KI-Systeme adaptieren in Echtzeit und lösen komplexe Aufgaben

Fortschritt von Poetiq im ARC-AGI-2 Benchmark

Das KI-Start-up Poetiq hat mit seiner neuesten Technologie einen beeindruckenden Fortschritt beim ARC-AGI-2 Benchmark erzielt. Dieser Test gilt als Maßstab für die Fähigkeit einer KI, abstrakt und adaptiv zu denken – also neue Fähigkeiten zu entwickeln, anstatt nur bestehende Daten wiederzugeben. Poetiqs System, das auf OpenAIs GPT-5.2 basiert, erreichte eine Genauigkeit von 75 Prozent. Zum Vergleich: Der Durchschnitt menschlicher Teilnehmer liegt bei 60 Prozent.

Besondere Merkmale von Poetiqs Ansatz

Besonders bemerkenswert ist, dass Poetiq für den ARC-Test kein spezielles Training benötigte und dennoch eine signifikante Verbesserung der Genauigkeit erzielte, während die Kosten pro Aufgabe niedriger blieben. Der Schlüssel zu diesem Erfolg liegt in einem speziellen Verfahren, bei dem die KI eigenständig Code zur Lösung von Aufgaben generiert, diesen ausführt und bei Bedarf selbstständig korrigiert.

Vergleich mit anderen KI-Modellen

Ein Blick auf andere KI-Modelle zeigt, dass auch sie ähnliche Fortschritte machen. Während frühere Tests oft zeigten, dass KIs an komplexen Aufgaben scheiterten, nutzen moderne Modelle mittlerweile ausgeklügelte Techniken, um diese Herausforderungen zu meistern. Das könnte darauf hindeuten, dass die ursprünglich hohe Hürde des ARC-Tests bereits überwunden ist.

Wandel in der Arbeitsweise von KIs

Die Ergebnisse der Benchmarks verdeutlichen einen Wandel in der Arbeitsweise von KIs: Anstatt sich ausschließlich auf vorab trainierte Daten zu stützen, sind sie nun in der Lage, in Echtzeit zu adaptieren. Mechanismen wie die Programmsynthese ermöglichen es ihnen, Aufgaben erfolgreich zu lösen. Dieser Wandel verschiebt den Fokus der Forschung zunehmend von umfangreichen Trainingsdaten hin zu effizienteren Anpassungsprozessen.

Zukunftspläne für den ARC-Test

In Zukunft planen die Entwickler hinter dem ARC-Test, neue und noch anspruchsvollere Tests zu entwickeln, um die „Handlungsfähigkeit“ von KI-Systemen genauer zu untersuchen.

Quellen

  • Quelle: Poetiq
  • Der ursprüngliche Artikel wurde hier veröffentlicht
  • Dieser Artikel wurde im Podcast KI-Briefing-Daily behandelt. Die Folge kannst du hier anhören.

💡Über das Projekt KI News Daily

Dieser Artikel wurde vollständig mit KI generiert und ist Teil des Projektes KI News Daily der Pickert GmbH.

Wir arbeiten an der ständigen Verbesserung der Mechanismen, können aber leider Fehler und Irrtümer nicht ausschließen. Sollte dir etwas auffallen, wende dich bitte umgehend an unseren Support und feedback[at]pickert.io

Vielen Dank! 🙏

Das könnte dich auch interessieren…

Nvidia Cosmos: KI versteht die Welt in 3D

Nvidia Cosmos: KI versteht die Welt in 3D

Die nächste Generation der KI bringt bahnbrechende Entwicklungen mit sich, die das Verständnis von physikalischen Vorgängen revolutionieren.In KürzeNvidia präsentiert „Cosmos“ für 3D-SimulationenRoboter lernen, physikalische Reaktionen eigenständig zu antizipierenMeta...