Anthropic testete Claude‑Agenten als Slack‑Marktplatz.
- 69 Teilnehmende; Agenten handelten autonom.
- Opus lieferte höhere Erlöse als Haiku.
- Risiko: unsichtbare Ungleichheit und fehlende Regeln.
Im Dezember 2025 hat Anthropic ein ungewöhnliches Experiment gestartet: Eine Woche lang lief in ihrem San‑Francisco‑Büro ein Kleinanzeigen‑Marktplatz — komplett über Slack und gesteuert von KI‑Agenten. 69 Mitarbeitende bekamen je 100 US‑Dollar, die Anzeigen, Angebotserstellung, Verhandlungen und Abschlüsse übernahmen autonome Instanzen der Claude‑Modelle. Physische Waren wurden erst am Ende der Woche tatsächlich getauscht.
Was genau lief da ab?
Anthropic nannte das Vorhaben „Project Deal“. Zwei Varianten der Claude‑Agenten traten gegeneinander an: Claude Opus (das stärkere Frontier‑Modell) und Claude Haiku (kleineres Modell). Die KI‑Agenten handelten im Namen von Mitarbeitenden autonom — sie schalteten Anzeigen, setzten Preise, verhandelten und schlossen Deals ab. Vorab führten die Agenten kurze Interviews mit ihren Auftraggeber:innen, um Zielpreise und Verhandlungsstil festzulegen.
Versuchsaufbau
Es gab vier parallele Marktplätze: In zwei liefen alle Agenten auf Opus, in den beiden anderen wurde jede Person mit 50‑Prozent‑Wahrscheinlichkeit einem Haiku‑Agenten zugewiesen. So entstanden Vergleichsszenarien zwischen komplett starken‑Agenten‑Märkten und gemischten Märkten mit unterschiedlicher Agentenstärke.
Was kam dabei heraus?
- Die wirtschaftlichen Ergebnisse fielen zugunsten der stärkeren Agenten aus.
- In den Opus‑Durchläufen wurden 186 Deals mit einem Gesamtwert von knapp 4.000 US‑Dollar abgeschlossen.
- In den gemischten Durchläufen schlossen Opus‑Nutzer im Schnitt etwa zwei Deals mehr ab als Haiku‑Nutzer.
- Wenn derselbe Artikel einmal von Opus und einmal von Haiku angeboten wurde, brachte Opus im Durchschnitt 3,64 US‑Dollar mehr ein.
- Über 161 mehrfach verkaufte Artikel lag der Vorteil bei rund 2,68 US‑Dollar pro Opus‑Verkäufer.
- Käufer, die einen Opus‑Agenten nutzten, zahlten im Schnitt etwa 2,45 US‑Dollar weniger.
- Ein konkretes Beispiel: Ein Rubin ging bei Opus für 65 US‑Dollar weg, bei Haiku für 35 US‑Dollar.
Wie die Teilnehmenden das sahen
Trotz der messbaren Unterschiede nahmen viele Teilnehmende Nachteile kaum wahr: Die Fairness‑Bewertung lag im Mittel bei rund 4 von 7 und war für Haiku‑ und Opus‑Nutzer praktisch identisch (≈4,05 vs. 4,06). Von 28 Personen, die beide Varianten erlebten, zogen 17 den Opus‑Durchlauf vor, 11 favorisierten Haiku.
Welche Rolle hatten Instruktionen und Taktik?
Anthropic analysierte auch, ob aggressivere Instruktionen die Ergebnisse beeinflussen. Aufforderungen zu härterem Vorgehen zeigten nur geringe Effekte — höhere Verkaufspreise bei aggressiv instruierten Verkäuferinnen erklärten sich vor allem durch höher angesetzte Anfangspreise, nicht durch effektivere Verhandlungstaktiken während der Interaktion.
Welche Risiken und Fragen bleiben offen?
Anthropic warnt vor einer möglichen „unsichtbaren Ungleichheit“: In echten Märkten könnten unterschiedlich starke Agenten Menschen benachteiligen, ohne dass die Betroffenen es merken. Fast die Hälfte der Teilnehmenden (46 Prozent) würde für einen solchen Service bezahlen. Gleichzeitig bringt die Automatisierung neue Risiken:
- Unternehmensinteressen könnten andere Anreize setzen.
- Für handelnde Agenten tauchen neue Angriffsflächen wie „jailbreaking“ oder „prompt injection“ auf.
- Rechtliche und politische Regeln für autonome Transaktionen fehlen laut Anthropic bislang; weitere Forschung wird gefordert.
Kontext
Project Deal reiht sich in eine Reihe von Experimenten ein: Anthropic hatte zuvor bereits ähnliche Tests durchgeführt, etwa unter dem Namen Project Vend.
Quellen
- Quelle: Anthropic
- Der ursprüngliche Artikel wurde hier veröffentlicht
- Dieser Artikel wurde im Podcast KI-Briefing-Daily behandelt. Die Folge kannst du hier anhören.




