Cloudflare prüfte Anthropic‑KI Mythos: Sie schreibt, kompiliert und führt Code, um Schwachstellen zu kombinieren und ihre Ausnutzbarkeit zu belegen.
In Kürze
- Mythos verknüpft kleine Fehler zu funktionierenden Exploitketten.
- Modell schreibt, kompiliert und führt Code zur Reproduzierbarkeit aus.
- Project Glasswing nutzte bis zu 50 Agenten; Funktion ist nützlich, birgt aber Missbrauchsrisiken.
Cloudflare hat die Sicherheits-KI Mythos Preview von Anthropic in einem internen Testlauf untersucht — und zwar im Rahmen von Project Glasswing an mehr als 50 eigenen Code-Repositories.
Das Besondere: Mythos verbindet mehrere kleine Schwachstellen zu funktionierenden Exploitketten und liefert dafür eigenständig Belege, indem es Code schreibt, diesen in ein ausführbares Programm übersetzt und ausführt.
Was heißt das genau?
Statt nur einzelne Bugs zu melden, setzt Mythos die gefundenen Schwachstellen zusammen, sodass daraus ein tatsächlicher Angriffsweg entsteht — eine sogenannte Exploitkette. Cloudflare berichtet, dass die Resultate dadurch weniger spekulativ wirkten, die Schritte zur Reproduktion klarer formuliert waren und insgesamt weniger Nacharbeit durch Menschen nötig wurde.
Im Test schrieb das Modell eigenen Code, kompilierte ihn und führte ihn aus, um die Ausnutzbarkeit der kombinierten Schwachstellen zu demonstrieren. Damit lieferte Mythos nicht nur Hinweise auf potenzielle Probleme, sondern konkrete Belege für deren praktische Verwendbarkeit.
Cloudflares CSO Grant Bourzikas zieht einen Vergleich zu früheren Frontier-Modellen: Diese hätten zwar vergleichbare Einzelfehler gefunden und teils tiefe Analysen geliefert, konnten laut Bourzikas die Fehler aber meist nicht zu ausgeführten Angriffen zusammensetzen oder die tatsächliche Ausnutzbarkeit sicher belegen.
Wichtig für das Test-Setup:
Cloudflare setzte nicht auf einen einzelnen automatisierten Prozess, sondern auf ein mehrstufiges System mit bis zu 50 parallel arbeitenden Agenten. Ein Agent ist dabei ein automatisierter Teilprozess, der spezielle Aufgaben übernimmt. Die Agenten prüfen sich gegenseitig, um die Ergebnisse zu verifizieren und Fehlalarme zu reduzieren.
Cloudflare weist zudem auf die zweischneidige Natur solcher Fähigkeiten hin: Funktionen, die Verteidigern helfen, können potenziell auch von Angreifern genutzt werden. Die Beobachtungen stammen aus dem Bericht zu Project Glasswing und Aussagen von CSO Grant Bourzikas.
Quellen
- Quelle: Cloudflare / Anthropic
- Der ursprüngliche Artikel wurde hier veröffentlicht
- Dieser Artikel wurde im Podcast KI-Briefing-Daily behandelt. Die Folge kannst du hier anhören.




