Deepseek macht 75%-Rabatt auf V4‑Pro permanent – Druck auf KI‑Preise

24.05.2026 | Allgemein, KI

Deepseek macht 75%-Rabatt auf V4‑Pro dauerhaft und erhöht den Preisdruck.

In Kürze

  • Rabatt permanent
  • V4‑Pro deutlich günstiger als GPT‑5.5
  • Relevant für tokenintensive Workloads

Deepseek hat den 75%-Rabatt auf sein Spitzenmodell DeepSeek‑V4‑Pro dauerhaft gemacht – eine Aktion, die ursprünglich am 31. Mai 2026 enden sollte. Die Folge: starke Preisdruckeffekte im Markt, weil das Unternehmen die Kosten für Entwickler deutlich senkt und die Hürde zur Migration reduziert.

Was genau passiert ist

Deepseek hat die Rabattaktion auf DeepSeek‑V4‑Pro in eine permanente Preisgestaltung überführt. Ziel der Maßnahme ist laut Ankündigung, Entwickler durch sehr niedrige Preise zum Umstieg zu bewegen. Um die Migration zu erleichtern, unterstützen Deepseek‑Modelle sowohl das OpenAI‑ als auch das Anthropic‑API‑Format.

Preise (pro 1 Million Tokens)

  • DeepSeek‑V4‑Pro: Input $0,435; Input bei Cache‑Treffern $0,003625; Output $0,87
  • DeepSeek‑V4‑Flash: Input $0,14; Input Cache $0,0028; Output $0,28
  • GPT‑5.5: Input $5,00; Input Cache $0,50; Output $30,00
  • GPT‑5.5 (Long Context, >270k): Input $10,00; Input Cache $1,00; Output $45,00
  • Opus 4.7: Input $5,00; Input Cache $0,50; Output $25,00

Was diese Zahlen bedeuten

Token sind die Abrechnungseinheit (etwa Wörter oder Wortteile), das Kontextfenster beschreibt, wie viel Text ein Modell gleichzeitig verarbeiten kann. Deepseek‑Modelle bieten ein Kontextfenster von bis zu einer Million Tokens und bis zu 384.000 Output‑Tokens. Dank der neuen Preise ist DeepSeek‑V4‑Pro beim Input rund elfmal günstiger als GPT‑5.5 und beim Output mindestens rund 35‑mal günstiger. V4‑Flash liegt noch unterhalb dieser Werte. Cache‑Treffer können die Input‑Kosten pro Token zusätzlich drastisch senken.

Warum reine Token‑Preise nicht alles sind

Der reine Preis pro Token ist nur ein Teil der Rechnung. Entscheidend ist auch, wie viele Tokens ein Modell pro Aufgabe verbraucht. Ein günstiger Tokenpreis nutzt wenig, wenn das Modell deutlich mehr Tokens benötigt als ein Konkurrent. Beispiele aus dem Markt: Googles Gemini Flash 3.5 verbraucht in der Praxis mehr Tokens als sein Vorgänger; auch Opus 4.7 zieht mehr Tokens als frühere Versionen. GPT‑5.5 wiederum benötigt weniger Tokens als GPT‑5.4. Insgesamt zeigen Beobachtungen, dass viele aktuelle Modelle gegenüber ihren Vorgängern in der Praxis 30–90 % teurer ausfallen können.

Auswirkungen auf Unternehmen und Markt

Deepseek scheint in der aktuellen Phase weniger umsatzgetrieben aufzutreten als Anbieter wie OpenAI oder Anthropic, die beide einen Börsengang anstreben. Das erlaubt Deepseek, aggressiver preislich aufzutreten. Für Unternehmen bedeutet das: Bei Anwendungen mit hohem Token‑Verbrauch — etwa agentischen Systemen oder großen Dokumenten‑Workflows — gewinnt der Preis pro Token stark an Gewicht. In solchen Fällen kann es für Firmen wirtschaftlich sinnvoll sein, das günstigere Modell zu wählen, das für die jeweilige Aufgabe „gut genug“ arbeitet.

Einordnung

Leistungsmäßig ordnet sich DeepSeek‑V4 hinter Frontier‑Modellen wie GPT‑5.5 oder Opus 4.7 ein; wie groß der praktische Qualitätsunterschied bei konkreten Aufgaben ist, muss sich bei Tests zeigen. Preislich ist der Vorteil von Deepseek deutlich ausgeprägt, was dem Anbieter potenziell Marktanteile verschaffen kann.

Quellenangabe

Quellen

  • Quelle: Deepseek / OpenAI / Anthropic
  • Der ursprüngliche Artikel wurde hier veröffentlicht
  • Dieser Artikel wurde im Podcast KI-Briefing-Daily behandelt. Die Folge kannst du hier anhören.

💡Über das Projekt KI News Daily

Dieser Artikel wurde vollständig mit KI generiert und ist Teil des Projektes KI News Daily der Pickert GmbH.

Wir arbeiten an der ständigen Verbesserung der Mechanismen, können aber leider Fehler und Irrtümer nicht ausschließen. Sollte dir etwas auffallen, wende dich bitte umgehend an unseren Support und feedback[at]pickert.io

Vielen Dank! 🙏

Das könnte dich auch interessieren…