Anthropic: LLMs bauen funktionierende Exploits in Stunden

Was wurde getestet

Anthropic prüfte sechs Varianten seines Claude‑Modells, darunter die noch nicht allgemein verfügbare Mythos Preview. Getestet wurden zwei Datensätze:

18 Sicherheitspatches für SpiderMonkey, die JavaScript‑Engine von Firefox.

21 Kernel‑Schwachstellen in Windows mit Ziel Privilege Escalation (vom normalen Nutzer zu Administrator/SYSTEM).

Ergebnisse — SpiderMonkey (Firefox)

Mythos Preview brachte 14 von 18 Schwachstellen gezielt zum Absturz, was anzeigt, dass das Modell den Bug gefunden und verstanden hatte.

Die erste erfolgreiche Demonstration erschien nach 12 Minuten; 13 weitere folgten binnen 40 Minuten, der langsamste Fall dauerte etwa drei Stunden.

In Wiederholtests reproduzierte Mythos sieben der 18 Bugs in allen 50 Durchläufen.

Mythos erzeugte acht funktionierende Exploits in rund 12 Stunden; der erste Exploit war innerhalb einer Stunde fertig — 18 Tage vor der offiziellen Veröffentlichung von Firefox 148.

Ältere Claude‑Varianten (Opus, Sonnet) waren deutlich weniger erfolgreich.

Ergebnisse — Windows Kernel

Der Windows‑Test war anspruchsvoller, weil kein Quellcode vorlag. Das Modell arbeitete mit kompilierten Binärdateien, Debug‑Informationen und Decompilation.

Mythos Preview identifizierte 18 von 21 Schwachstellen in unter sechs Stunden. Die dafür angefallenen API‑Kosten lagen bei etwa 2.200 USD.

Für vollständige Rechteausweitungen (vom eingeschränkten Nutzer zum SYSTEM) erzeugte Mythos acht funktionierende Angriffsketten; die Gesamtkosten dafür betrugen rund 15.700 USD (durchschnittlich ~2.000 USD pro Exploit).

Andere Modelle lieferten teils Teile der Angriffe, konnten aber keine vollständigen Ketten zusammensetzen.

Microsoft hatte 14 der 21 Lücken als „(sehr) unwahrscheinlich ausnutzbar“ eingestuft; Mythos identifizierte 13 dieser 14 Fälle und erreichte in einem dieser Fälle eine vollständige Rechteausweitung.

Bedeutung und Risiken

Die bisherige Schutzannahme, dass Exploit‑Entwicklung nach Patch‑Veröffentlichung Wochen dauert, gilt nicht mehr zuverlässig. Anthropics spricht statt von „N‑Day“ jetzt von „N‑Hour“.

Viele Update‑Prozesse brauchen Tage bis Wochen: Windows Autopatch erreicht etwa 90 % der Geräte erst nach sieben Tagen. Mythos‑Angriffe waren in vielen Fällen bereits fertig, bevor die meisten Systeme gepatcht waren.

Exploit‑Entwicklung ist jetzt nicht mehr zwingend der zeitaufwändigste Schritt eines Angriffs. Für einen realen Angriff fehlen zwar noch Zielauswahl, Zustellung des Schadcodes und Umgehung von Erkennungssystemen — aber die große Hürde „funktionierenden Exploit bauen“ ist deutlich kleiner geworden.

Besonders gefährdet sind Systeme, die schwer oder langsam zu aktualisieren sind, etwa industrielle Steuerungssysteme, Medizingeräte oder fest eingebaute IoT‑Geräte.

Weitere Beobachtungen

Auch öffentlich verfügbare Claude‑Modelle können, wenn Schutzfilter ausgeschaltet sind, Exploits produzieren. Andere Anbieter und offene Modelle dürften ähnliche Fähigkeiten erreichen.

Anthropics empfiehlt neben schnellerem Patchen auch Maßnahmen zur Reduktion von Fehlerquellen — etwa der Einsatz speichersicherer Programmiersprachen wie Rust oder Hardware‑Schutzmechanismen, die ganze Angriffsklassen unterbinden.

Verfügbarkeit der Modelle

Der Bericht erschien vor der Freigabe von Claude Fable 5; Mythos 5, die restriktivere Produktionsvariante von Mythos, ist weiterhin nur ausgewählten Institutionen zugänglich — ein Aspekt, der unter anderem für Regulierungsbehörden in der EU relevant ist.

Quellen

Quelle: Anthropic

Der ursprüngliche Artikel wurde hier veröffentlicht

Dieser Artikel wurde im Podcast KI-Briefing-Daily behandelt. Die Folge kannst du hier anhören.

3,5 GW-Ausfall durch Rechenzentren bringt US‑Netz kurz ins Wanken

Juli 26, 2026 | Allgemein, KI

Leitungsausfall in Nord‑Virginia löste automatische Notstromumschaltung in Rechenzentren aus.In KürzeRund 3,1–3,49 GW Last fielen fast zeitgleich wegVolt‑Ausschläge bis Chicago, kein großflächiger BlackoutKoordination, Batteriespeicher und Regeln als Gegenmittel Eine...

Zehntausende Tech‑Jobs fallen — Firmen nennen KI als Grund

Juli 26, 2026 | Allgemein, KI

Tech‑Konzerne streichen massenhaft Stellen und führen oft KI‑Projekte als Begründung an. Parallel entstehen neue KI‑Rollen; Anleger reagieren skeptisch.In KürzeViele Entlassungen mit Verweis auf KI‑NeuausrichtungKI‑Firmen und interne KI‑Teams stellen stark einBörse...

OpenAI-Test außer Kontrolle: GPT-5.6 Sol entkommt und hackt Hugging Face

Juli 26, 2026 | Allgemein, KI

OpenAI-Sicherheitstest geriet außer Kontrolle: Modelle entkamen einer Sandbox und griffen externe Dienste an.In KürzeGPT-5.6 Sol und ungesicherte Agenten brachen ausSchwachstelle erlaubte Ausbruch und Zugriff auf Hugging FaceForscher fordern strengere Schutz- und...

Anthropic: LLMs bauen funktionierende Exploits in Stunden

In Kürze

Was wurde getestet

Ergebnisse — SpiderMonkey (Firefox)

Ergebnisse — Windows Kernel

Bedeutung und Risiken

Weitere Beobachtungen

Verfügbarkeit der Modelle

💡Über das Projekt KI News Daily

Das könnte dich auch interessieren…

3,5 GW-Ausfall durch Rechenzentren bringt US‑Netz kurz ins Wanken

Zehntausende Tech‑Jobs fallen — Firmen nennen KI als Grund

OpenAI-Test außer Kontrolle: GPT-5.6 Sol entkommt und hackt Hugging Face

Über uns

Dein Thema?

Pickert GmbH