KI‑Agenten werden meist mit Programmieraufgaben geprüft, nicht mit realen Berufsanforderungen.In KürzeProgrammierung dominiert Benchmarks (7,6% der Jobs)Management, Recht und Architektur sind stark unterrepräsentiertForderung: breitere Domänen, realistischere und feinere Tests Viele KI‑Agenten...




