Studie zeigt: Mehr Rechenzeit verbessert KI-Leistung und Selbstbewusstsein

Untersuchung der Johns Hopkins University zur Rechenzeit von KI-Systemen

Eine aktuelle Studie der Johns Hopkins University untersucht, wie sich zusätzliche Rechenzeit auf die Leistung von KI-Systemen auswirkt. Die Forscher haben ein neues Bewertungssystem entwickelt, das bestehende Schwächen in der Beurteilung von KI-Modellen adressiert. Ein zentrales Problem herkömmlicher Methoden besteht darin, dass KI oft gezwungen ist, eine Antwort zu liefern, unabhängig davon, wie sicher sie sich ist. Dies kann in kritischen Situationen zu problematischen Ergebnissen führen, wenn falsche Antworten erhebliche Folgen haben können.

Test von KI-Modellen mit variierender Rechenzeit

In der Untersuchung wurden zwei KI-Modelle mit mathematischen Aufgaben getestet, wobei die zur Verfügung stehende Rechenzeit variiert wurde. Die Ergebnisse zeigen, dass mehr Zeit den Modellen nicht nur hilft, genauere Antworten zu geben, sondern auch besser einzuschätzen, wann sie lieber keine Antwort liefern sollten. Sie entwickeln ein besseres Gespür für ihre eigenen Grenzen und zeigen bei sicheren Antworten mehr Selbstbewusstsein.

Vergleich in verschiedenen Risikosituationen

Besonders aufschlussreich ist der Vergleich der beiden Modelle in verschiedenen Risikosituationen. Die Forscher untersuchten Szenarien ohne Strafen für falsche Antworten sowie solche mit hohen Strafen für Fehler, wie sie in kritischen Kontexten vorkommen könnten. In diesem Zusammenhang schnitt das Modell DeepSeek R1-32B unter strengeren Bedingungen besonders gut ab.

Einschränkungen der Studie

Die Studie weist jedoch darauf hin, dass die Methode zur Einschätzung der Zuverlässigkeit der Antworten auf bestimmten Annahmen basiert und nicht alle Unsicherheiten der Modelle abdeckt. Zudem wurden die Tests in englischer Sprache und mit mathematischen Aufgaben durchgeführt, was bedeutet, dass die Ergebnisse nicht ohne Weiteres auf andere Bereiche übertragbar sind.

Empfehlungen für zukünftige Arbeiten

Die Forscher empfehlen, zukünftige Arbeiten sowohl in Testszenarien ohne Strafen als auch in solchen mit gewichteten Strafen durchzuführen. So können Entwickler ein besseres Verständnis für das Verhalten ihrer Systeme in unterschiedlichen Risikokontexten erlangen.

Quellen

Quelle: Johns Hopkins University

Der ursprüngliche Artikel wurde hier veröffentlicht

Dieser Artikel wurde im Podcast KI-Briefing-Daily behandelt. Die Folge kannst du hier anhören.

Claude Tag zieht dauerhaft in Slack ein — sichtbarer KI‑Kollege fürs Team

Juni 24, 2026 | Allgemein, KI

Anthropic führt Claude Tag ein: ein dauerhaft präsenter KI-Assistent in Slack, der Kontext speichert und Arbeiten strukturiert.In KürzeBleibt dauerhaft in Kanälen aktiv, baut Kontext aufAdmin-gesteuerte Zugriffs- und ToolkontrolleZerlegt Aufgaben, arbeitet Schritte ab...

OpenAI verlegt Fokus: Daybreak automatisiert Patch‑Erstellung und Verifikation

Juni 24, 2026 | Allgemein, KI

Daybreak setzt auf automatisches Patchen statt nur Bug‑Finden.In KürzeCodex‑Security scannt Millionen CommitsGPT‑5.5‑Cyber erzeugt und verifiziert PatchesZugang nur für verifizierte Verteidiger OpenAI verschiebt den Schwerpunkt in seiner Cybersecurity-Offensive...

Microsoft plant 2-GW-KI-Rechenzentrum in Pecos mit eigenem Gaskraftwerk

Juni 24, 2026 | Allgemein, KI

Microsoft plant in Pecos ein 2GW-KI-Rechenzentrum mit Gaskraftwerk.In Kürze2GW Rechenzentrum, Kraftwerk 2,67GWChevron liefert Gas 20 JahreStart 2028 Microsoft plant in Pecos (Westtexas) ein riesiges KI-Rechenzentrum — und legt gleich sein eigenes Gaskraftwerk mit...

Studie zeigt: Mehr Rechenzeit verbessert KI-Leistung und Selbstbewusstsein

In Kürze

Untersuchung der Johns Hopkins University zur Rechenzeit von KI-Systemen

Test von KI-Modellen mit variierender Rechenzeit

Vergleich in verschiedenen Risikosituationen

Einschränkungen der Studie

Empfehlungen für zukünftige Arbeiten

💡Über das Projekt KI News Daily

Das könnte dich auch interessieren…

Claude Tag zieht dauerhaft in Slack ein — sichtbarer KI‑Kollege fürs Team

OpenAI verlegt Fokus: Daybreak automatisiert Patch‑Erstellung und Verifikation

Microsoft plant 2-GW-KI-Rechenzentrum in Pecos mit eigenem Gaskraftwerk

Über uns

Dein Thema?

Pickert GmbH