Poetiq erzielt Rekord beim ARC-AGI-2 Benchmark – KI denkt adaptiv

Fortschritt von Poetiq im ARC-AGI-2 Benchmark

Das KI-Start-up Poetiq hat mit seiner neuesten Technologie einen beeindruckenden Fortschritt beim ARC-AGI-2 Benchmark erzielt. Dieser Test gilt als Maßstab für die Fähigkeit einer KI, abstrakt und adaptiv zu denken – also neue Fähigkeiten zu entwickeln, anstatt nur bestehende Daten wiederzugeben. Poetiqs System, das auf OpenAIs GPT-5.2 basiert, erreichte eine Genauigkeit von 75 Prozent. Zum Vergleich: Der Durchschnitt menschlicher Teilnehmer liegt bei 60 Prozent.

Besondere Merkmale von Poetiqs Ansatz

Besonders bemerkenswert ist, dass Poetiq für den ARC-Test kein spezielles Training benötigte und dennoch eine signifikante Verbesserung der Genauigkeit erzielte, während die Kosten pro Aufgabe niedriger blieben. Der Schlüssel zu diesem Erfolg liegt in einem speziellen Verfahren, bei dem die KI eigenständig Code zur Lösung von Aufgaben generiert, diesen ausführt und bei Bedarf selbstständig korrigiert.

Vergleich mit anderen KI-Modellen

Ein Blick auf andere KI-Modelle zeigt, dass auch sie ähnliche Fortschritte machen. Während frühere Tests oft zeigten, dass KIs an komplexen Aufgaben scheiterten, nutzen moderne Modelle mittlerweile ausgeklügelte Techniken, um diese Herausforderungen zu meistern. Das könnte darauf hindeuten, dass die ursprünglich hohe Hürde des ARC-Tests bereits überwunden ist.

Wandel in der Arbeitsweise von KIs

Die Ergebnisse der Benchmarks verdeutlichen einen Wandel in der Arbeitsweise von KIs: Anstatt sich ausschließlich auf vorab trainierte Daten zu stützen, sind sie nun in der Lage, in Echtzeit zu adaptieren. Mechanismen wie die Programmsynthese ermöglichen es ihnen, Aufgaben erfolgreich zu lösen. Dieser Wandel verschiebt den Fokus der Forschung zunehmend von umfangreichen Trainingsdaten hin zu effizienteren Anpassungsprozessen.

Zukunftspläne für den ARC-Test

In Zukunft planen die Entwickler hinter dem ARC-Test, neue und noch anspruchsvollere Tests zu entwickeln, um die „Handlungsfähigkeit“ von KI-Systemen genauer zu untersuchen.

Quellen

Quelle: Poetiq

Der ursprüngliche Artikel wurde hier veröffentlicht

Dieser Artikel wurde im Podcast KI-Briefing-Daily behandelt. Die Folge kannst du hier anhören.

Grammarlys „Expert Review“ nennt prominente Stimmen — ohne Rückfrage

März 7, 2026 | Allgemein, KI

Grammarlys „Expert Review“ liefert Stiltipps in Stimmen bekannter Autor:innen — viele Namen tauchten ohne Rückfrage auf.In KürzeAutomatische VorschlägeNamen ohne ZustimmungFehlerhafte Quellen & Abstürze Grammarly bietet jetzt “Expert Review” — mit Namen, die nicht...

EU-Parlament drängt auf Kennzeichnungspflicht fürs KI‑Training – Kommission zögert

März 7, 2026 | Allgemein, KI

Parlament fordert verbindliche, maschinenlesbare Regeln für KI‑Training; Kommission plant Prüfung erst 2026.In KürzeMaschinenlesbare Kennzeichnung vorgeschlagenKommission: Evaluierung frühestens 2026Vergütung, Kontrolle und Haftung bleiben offen KI-Training und...

Meta erlaubt Konkurrenz‑Chatbots auf WhatsApp — befristet und kostenpflichtig

März 7, 2026 | Allgemein, KI

Meta lässt Konkurrenz‑KI für 12 Monate auf die WhatsApp Business API — aber nur gegen Gebühren pro Antwort.In KürzeBefristeter Zugang: 12 MonateGebühren: 0,049–0,13 € pro KI‑AntwortEU‑Kommission führt kartellrechtliche Prüfung fort Meta lässt Konkurrenz‑Chatbots...

Poetiq erzielt Rekord beim ARC-AGI-2 Benchmark – KI denkt adaptiv

In Kürze

Fortschritt von Poetiq im ARC-AGI-2 Benchmark

Besondere Merkmale von Poetiqs Ansatz

Vergleich mit anderen KI-Modellen

Wandel in der Arbeitsweise von KIs

Zukunftspläne für den ARC-Test

💡Über das Projekt KI News Daily

Das könnte dich auch interessieren…

Grammarlys „Expert Review“ nennt prominente Stimmen — ohne Rückfrage

EU-Parlament drängt auf Kennzeichnungspflicht fürs KI‑Training – Kommission zögert

Meta erlaubt Konkurrenz‑Chatbots auf WhatsApp — befristet und kostenpflichtig

Über uns

Dein Thema?

Pickert GmbH