KI-Modell erzielt bessere Erst-Triage als zwei internistische Oberärzt:innen

Worum ging es?

Forscher der Harvard Medical School und des Beth Israel Deaconess Medical Center haben geprüft, wie gut große Sprachmodelle (LLMs) bei medizinischen Erstdiagnosen abschneiden. Untersucht wurde vor allem die Erst-Triage — also die erste Einschätzung bei begrenzten Informationen und oft hoher Dringlichkeit — anhand realer Fälle aus der Notaufnahme.

Wie wurde getestet?

Für 76 Patient:innen aus der Notaufnahme wurden die Diagnosen zweier internistisch tätiger Oberärzt:innen mit den Antworten von OpenAIs Modellen o1 und 4o verglichen. Grundlage waren ausschließlich die Informationen aus der elektronischen Krankendokumentation zu dem jeweiligen Zeitpunkt; es wurden keine Daten nachträglich verändert. Weitere Oberärzt:innen bewerteten die Diagnosen anonymisiert — sie wussten nicht, ob eine Mensch oder eine KI die Einschätzung abgegeben hatte.

Was die Studienleiter:innen betonen

Die Forschenden sehen die Ergebnisse als vielversprechend, warnen jedoch davor, KI-Modelle schon jetzt Entscheidungen über Leben und Tod treffen zu lassen.

Sie fordern prospektive Studien — also Tests unter realen klinischen Bedingungen — bevor solche Systeme in den Praxisbetrieb übernommen werden. Außerdem gilt: Die Studie nutzte nur Textdaten; bei anderen Eingaben wie Bildern sind die Modelle offenbar weniger leistungsfähig.

Kritikpunkte und offene Fragen

Verantwortlichkeit: Es gibt derzeit keine formalen Lösungen für Haftungs- und Verantwortungsfragen bei KI-Diagnosen. Ärzt:innen weisen darauf hin, dass Patient:innen bei wichtigen Entscheidungen weiterhin menschliche Begleitung wollen.

Vergleichsgruppe: Eine Notfallärztin kritisierte, dass die Studie internistische Oberärzt:innen mit der KI verglich, nicht Notfallmediziner:innen. In der Notaufnahme steht oft die Erkennung lebensbedrohlicher Zustände im Vordergrund — das unterscheidet die Aufgabe von der internistischen Diagnostik.

Begrenzte Datengrundlage: Die Tests basierten ausschließlich auf Textinformationen aus der Krankenakte; reale Kliniksituationen sind komplexer und beinhalten zusätzliche Informationen wie Untersuchungsbefunde und Bilder.

Hinweis zur Meldung

Der ursprüngliche Artikel wurde aktualisiert, um klarzustellen, dass die verglichenen Ärzt:innen internistische Oberärzt:innen waren, und um die kritische Stellungnahme einer Notfallärztin aufzunehmen.

Quellen

Quelle: Harvard Medical School / Beth Israel Deaconess Medical Center

Der ursprüngliche Artikel wurde hier veröffentlicht

Dieser Artikel wurde im Podcast KI-Briefing-Daily behandelt. Die Folge kannst du hier anhören.

Atlantic veröffentlicht Datenbank mit Millionen Songs – Rechte oft unklar

Juni 21, 2026 | Allgemein, KI

Eine durchsuchbare Liste zeigt Songs, die offenbar für KI‑Training genutzt wurden – häufig ohne Rücksicht auf Lizenzen.In KürzeVier Datensätze identifiziert, zwei mit rund 12 Mio. und 9 Mio. TitelnAutomatisierte Downloads umgehen Plattform‑Mechanismen und...

Damodaran warnt vor KI-Crash: Schulden, Infrastruktur und Jobrisiken

Juni 21, 2026 | Allgemein, KI

NYU-Professor Aswath Damodaran sieht echte Risiken: teure Infrastruktur, schwache Skaleneffekte und Preisdruck könnten Firmen und Jobs treffen.In KürzeMassive Investitionen in Rechenzentren und SchuldenrisikenSkaleneffekte sind begrenzt — jede Anfrage kostet...

OpenAI-Codex für macOS nimmt Abläufe auf und speichert ‚Skills‘

Juni 21, 2026 | Allgemein, KI

Codex (macOS) nimmt Abläufe auf und spielt sie als Skill ab.In KürzeSkills aus AufnahmenNicht in EU/GB/CH; 'Computer Use' nötigMassenaktionen & Host-Übergabe OpenAI hat der Codex-App für macOS ein neues Feature verpasst: Record & Replay. Du kannst der KI einmal...

KI-Modell erzielt bessere Erst-Triage als zwei internistische Oberärzt:innen

In Kürze

Worum ging es?

Wie wurde getestet?

Die wichtigsten Zahlen

Was die Studienleiter:innen betonen

Kritikpunkte und offene Fragen

Nächste Schritte

Hinweis zur Meldung

💡Über das Projekt KI News Daily

Das könnte dich auch interessieren…

Atlantic veröffentlicht Datenbank mit Millionen Songs – Rechte oft unklar

Damodaran warnt vor KI-Crash: Schulden, Infrastruktur und Jobrisiken

OpenAI-Codex für macOS nimmt Abläufe auf und speichert ‚Skills‘

Über uns

Dein Thema?

Pickert GmbH