Proof-of-Concept zeigt: Lokale LLMs auf gehackten Geräten planen und verbreiten adaptive Malware.
In Kürze
- LLMs erzeugen Exploits lokal und umgehen Cloud-Limits
- Labortests: Rechteerweiterung und Ausbreitung auf bis zu 20 % der Geräte
- KI generierte Angriffe trafen auch Lücken nach Modell-Trainingszeitraum
Forscher aus Toronto, dem Vector Institute, Cambridge und ServiceNow Research haben einen Proof-of-Concept veröffentlicht, der zeigt: Künstliche Intelligenz kann einen neuen Typ Computerwurm ermöglichen — einen sich selbst anpassenden, schwer aufzuhaltenden Schädling.
Was anders ist
Klassische Würmer wie WannaCry nutzten klar definierte Sicherheitslücken und ließen sich oft durch Patches stoppen. Der neue Ansatz setzt dagegen auf KI: Auf kompromittierten Geräten laufen offene große Sprachmodelle (LLMs), die zur Planung von Angriffen und zur Erzeugung von Exploits genutzt werden. Weil die Modelle lokal auf den gekaperten Rechnern arbeiten, fallen für die Angreifer kaum externe Kosten an; Verteidigerinnen und Verteidiger müssten KI-Ressourcen selbst betreiben, wenn sie KI zur Abwehr einsetzen wollen. Außerdem umgeht dieser Ansatz zentrale Sicherheitsprüfungen und Ratenbegrenzungen kommerzieller KI-Dienste, da die Intelligenz nicht aus der Cloud, sondern direkt auf den infizierten Systemen agiert.
Wie das getestet wurde
Die Forschenden führten Experimente in einem isolierten Labornetzwerk mit 33 Geräten durch — darunter:
- Linux-Server
- Windows-Rechner
- IoT-Geräte
In mehreren sieben Tage langen Testläufen ergaben sich folgende Befunde:
- Er erkannte etwa ein Drittel der vorhandenen Schwachstellen korrekt.
- Auf rund ein Viertel der Maschinen gelang ihm eine Rechteerweiterung (also mehr Kontrolle über das System).
- In einzelnen Läufen breitete er sich auf rund 20 % der Geräte aus.
- Er erreichte bis zu sieben Generationen der Selbstreplikation.
Zusammenfassend kommen die Autorinnen und Autoren zu dem Ergebnis, dass der Proof-of-Concept knapp 75 % des Netzwerks erfolgreich angegriffen und sich auf knapp zwei Drittel des Netzes repliziert habe — die unterschiedliche Darstellung hängt mit den Kennzahlen einzelner Testläufe versus der Gesamtauswertung zusammen.
Wichtiges Detail zu den Exploits
Die eingesetzten LLMs erzeugten zudem Exploits gegen drei Schwachstellen, die erst 2026 öffentlich wurden — also nach dem Trainingszeitraum der Modelle. Das zeigt, dass die KI nicht bloß bekannte Angriffscodes nachahmt, sondern aus öffentlich verfügbaren Informationen eigenständig funktionierende Angriffe konstruieren kann.
Die Warnung der Forschenden
Die Studienautorinnen und -autoren sprechen von sogenannten „autonomen generativen Gegnern“: Malware-Systemen, die sich ohne menschliches Zutun verbreiten und nicht länger durch vordefinierten Exploit-Code beschrieben sind, sondern durch die Fähigkeit, Ziele zu analysieren, sich anzupassen und in Echtzeit neue Angriffslogik zu entwickeln.
Quellen
- Quelle: University of Toronto / Vector Institute / University of Cambridge / ServiceNow Research
- Der ursprüngliche Artikel wurde hier veröffentlicht
- Dieser Artikel wurde im Podcast KI-Briefing-Daily behandelt. Die Folge kannst du hier anhören.




