Anthropic: LLMs bauen aus Patches in Stunden funktionierende Exploits.
In Kürze
- Mythos erzeugte Exploits für SpiderMonkey und Windows
- Patch-Fenster schrumpft von Tagen auf Stunden
- Maßnahmen: schneller patchen, Rust, Hardware-Schutz
Anthropics Sicherheitsteam hat gezeigt, dass große Sprachmodelle heute in sehr kurzer Zeit aus veröffentlichten Sicherheitspatches funktionierende Angriffe bauen können — oft in Stunden statt in Wochen. Das untergräbt die bisher verbreitete Annahme, dass Reverse Engineering von Patches langwierig ist, und verschiebt die Zeitfenster, in denen gepatchte Systeme noch als „sicher“ gelten.
Was wurde getestet
Anthropic prüfte sechs Varianten seines Claude‑Modells, darunter die noch nicht allgemein verfügbare Mythos Preview. Getestet wurden zwei Datensätze:
- 18 Sicherheitspatches für SpiderMonkey, die JavaScript‑Engine von Firefox.
- 21 Kernel‑Schwachstellen in Windows mit Ziel Privilege Escalation (vom normalen Nutzer zu Administrator/SYSTEM).
Ergebnisse — SpiderMonkey (Firefox)
- Mythos Preview brachte 14 von 18 Schwachstellen gezielt zum Absturz, was anzeigt, dass das Modell den Bug gefunden und verstanden hatte.
- Die erste erfolgreiche Demonstration erschien nach 12 Minuten; 13 weitere folgten binnen 40 Minuten, der langsamste Fall dauerte etwa drei Stunden.
- In Wiederholtests reproduzierte Mythos sieben der 18 Bugs in allen 50 Durchläufen.
- Mythos erzeugte acht funktionierende Exploits in rund 12 Stunden; der erste Exploit war innerhalb einer Stunde fertig — 18 Tage vor der offiziellen Veröffentlichung von Firefox 148.
- Ältere Claude‑Varianten (Opus, Sonnet) waren deutlich weniger erfolgreich.
Ergebnisse — Windows Kernel
- Der Windows‑Test war anspruchsvoller, weil kein Quellcode vorlag. Das Modell arbeitete mit kompilierten Binärdateien, Debug‑Informationen und Decompilation.
- Mythos Preview identifizierte 18 von 21 Schwachstellen in unter sechs Stunden. Die dafür angefallenen API‑Kosten lagen bei etwa 2.200 USD.
- Für vollständige Rechteausweitungen (vom eingeschränkten Nutzer zum SYSTEM) erzeugte Mythos acht funktionierende Angriffsketten; die Gesamtkosten dafür betrugen rund 15.700 USD (durchschnittlich ~2.000 USD pro Exploit).
- Andere Modelle lieferten teils Teile der Angriffe, konnten aber keine vollständigen Ketten zusammensetzen.
- Microsoft hatte 14 der 21 Lücken als „(sehr) unwahrscheinlich ausnutzbar“ eingestuft; Mythos identifizierte 13 dieser 14 Fälle und erreichte in einem dieser Fälle eine vollständige Rechteausweitung.
Bedeutung und Risiken
- Die bisherige Schutzannahme, dass Exploit‑Entwicklung nach Patch‑Veröffentlichung Wochen dauert, gilt nicht mehr zuverlässig. Anthropics spricht statt von „N‑Day“ jetzt von „N‑Hour“.
- Viele Update‑Prozesse brauchen Tage bis Wochen: Windows Autopatch erreicht etwa 90 % der Geräte erst nach sieben Tagen. Mythos‑Angriffe waren in vielen Fällen bereits fertig, bevor die meisten Systeme gepatcht waren.
- Exploit‑Entwicklung ist jetzt nicht mehr zwingend der zeitaufwändigste Schritt eines Angriffs. Für einen realen Angriff fehlen zwar noch Zielauswahl, Zustellung des Schadcodes und Umgehung von Erkennungssystemen — aber die große Hürde „funktionierenden Exploit bauen“ ist deutlich kleiner geworden.
- Besonders gefährdet sind Systeme, die schwer oder langsam zu aktualisieren sind, etwa industrielle Steuerungssysteme, Medizingeräte oder fest eingebaute IoT‑Geräte.
Weitere Beobachtungen
- Auch öffentlich verfügbare Claude‑Modelle können, wenn Schutzfilter ausgeschaltet sind, Exploits produzieren. Andere Anbieter und offene Modelle dürften ähnliche Fähigkeiten erreichen.
- Anthropics empfiehlt neben schnellerem Patchen auch Maßnahmen zur Reduktion von Fehlerquellen — etwa der Einsatz speichersicherer Programmiersprachen wie Rust oder Hardware‑Schutzmechanismen, die ganze Angriffsklassen unterbinden.
Verfügbarkeit der Modelle
Der Bericht erschien vor der Freigabe von Claude Fable 5; Mythos 5, die restriktivere Produktionsvariante von Mythos, ist weiterhin nur ausgewählten Institutionen zugänglich — ein Aspekt, der unter anderem für Regulierungsbehörden in der EU relevant ist.
Quellen
- Quelle: Anthropic
- Der ursprüngliche Artikel wurde hier veröffentlicht
- Dieser Artikel wurde im Podcast KI-Briefing-Daily behandelt. Die Folge kannst du hier anhören.




