RSAC-Studie: Apple Intelligence lässt sich per Prompt-Injection aushebeln

Hohe Trefferquote bei Tests

In einem Test mit 100 zufällig ausgewählten Eingaben konnten die Sicherheitsforscher in 76 Prozent der Fälle die Schutzmaßnahmen umgehen. Die Studie stammt vom Research-Team der RSAC und wurde auf der Konferenz als Paper vorgestellt. Das Ergebnis zeigt, wie effektiv die vorgestellten Techniken in der Praxis sind.

Wie Apple Intelligence aufgebaut ist

Apple kombiniert lokale, auf dem Gerät laufende, vergleichsweise schwächere Modelle mit leistungsfähigeren Modellen in einer privaten Cloud (Private Cloud Compute (PCC)). Diese Kombination — erst lokale Modelle, dann Cloud-Modelle — wurde zum Angriffspunkt: Schwächere lokale Modelle verarbeiten die manipulierten Eingaben und leiten sie so weiter, dass die stärkeren Cloud-Modelle unerwünschte Antworten liefern.

Welche Funktionen betroffen sind

Apps können die Modelle nutzen; Beispiele aus dem System sind:

Writing Tools (Textoptimierung)

Image Playground

Genmoji (Bild- bzw. Emoji-Generatoren)

Apple bietet derzeit keinen Chatbot-Modus an, aber die systemweiten Modelle stehen verschiedenen Funktionen offen, was die Angriffsfläche vergrößert.

Techniken der Angreifer — kurz erklärt

Neural Execs: Prompts werden kodiert oder „übersetzt“, sodass sie für Menschen kaum Sinn ergeben, das Modell aber dazu bringt, eine eigentlich verbotene Anweisung auszuführen.

Unicode-Tricks: Sonderzeichen wie Rechts-nach-Links-Steuerzeichen werden eingesetzt, damit schädliche Anweisungen in der Ausgabe „durchsickern“ und menschliche Kontrollen umgehen.

Mit diesen Methoden ließen sich sowohl interne Schutzvorrichtungen der Modelle als auch nachgelagerte Filter von Apple austricksen.

Warum das möglich ist

Schwächere lokale Modelle sind anfälliger für sogenannte Halluzinationen — also falsche oder erfundene Antworten — und lassen sich leichter manipulieren. Deshalb raten Expert:innen, keine zu schwachen Modelle lokal einzusetzen; das reduziert das Risiko, dass Angriffe erfolgreich sind (eine solche Empfehlung stammt unter anderem vom Sicherheitsforscher-Netzwerk OpenClaw).

Was Apple getan hat

Nach der Meldung der Schwachstellen im Oktober hat Apple laut den Forscherberichten Änderungen am Betriebssystem und an der privaten Cloud-Infrastruktur vorgenommen. Details zu den Patches nannte die Firma öffentlich nicht vollständig; die Forscher präsentierten ihre Ergebnisse dennoch auf der RSAC-Konferenz.

Die Kernbotschaft

Der Fall macht deutlich: Systeme, die zwischen lokalen und Cloud-Modellen wechseln oder lokale, weniger leistungsfähige Modelle nutzen, brauchen besonders robuste Schutzmechanismen. Andernfalls lassen sich vorhandene Guardrails umgehen und unerwünschte Ausgaben erzwingen.

Quellen

Quelle: Apple

Der ursprüngliche Artikel wurde hier veröffentlicht

Dieser Artikel wurde im Podcast KI-Briefing-Daily behandelt. Die Folge kannst du hier anhören.

SoftBank plant bis zu 75 Mrd. Euro für Rechenzentren in Frankreich

Mai 31, 2026 | Allgemein, KI

SoftBank will in Frankreich Rechenzentren mit bis zu 5 GW Kapazität bauen und bis zu 75 Mrd. Euro investieren.In KürzeBis zu 5 GW neue Kapazität; erste Phase: 3,1 GW in Nordfrankreich bis 2031Projekt gilt als SoftBanks größte KI‑Infrastruktur‑Investition in...

Post-Training macht Sprachmodelle weniger menschlich – Studie mit Helmholtz

Mai 31, 2026 | Allgemein, KI

Große Studie zeigt: Assistenz-Optimierung reduziert KIs' Nähe zum menschlichen Verhalten.In KürzeUnbearbeitete Basismodelle entsprechen Menschen stärker als AssistenzvariantenInstruction‑Tuning, RLHF und Vision‑Erweiterungen verringern Übereinstimmung, besonders beim...

LLMShare: Kriminelle verbreiten Malware über öffentliche Chat‑Links

Mai 31, 2026 | Allgemein, KI

Öffentliche Share‑Chats von ChatGPT und Claude werden als Trägermedium für Schadsoftware genutzt.In KürzeAttacken nutzen offizielle Domains und bezahlte Suche, um Vertrauen zu gewinnenGefälschte Support‑Seiten und Code‑Rendering locken zu infizierten Downloads oder...

RSAC-Studie: Apple Intelligence lässt sich per Prompt-Injection aushebeln

In Kürze

Hohe Trefferquote bei Tests

Wie Apple Intelligence aufgebaut ist

Welche Funktionen betroffen sind

Techniken der Angreifer — kurz erklärt

Warum das möglich ist

Was Apple getan hat

Die Kernbotschaft

💡Über das Projekt KI News Daily

Das könnte dich auch interessieren…

SoftBank plant bis zu 75 Mrd. Euro für Rechenzentren in Frankreich

Post-Training macht Sprachmodelle weniger menschlich – Studie mit Helmholtz

LLMShare: Kriminelle verbreiten Malware über öffentliche Chat‑Links

Über uns

Dein Thema?

Pickert GmbH