Deepseek macht 75%-Rabatt auf V4‑Pro dauerhaft und erhöht den Preisdruck.
In Kürze
- Rabatt permanent
- V4‑Pro deutlich günstiger als GPT‑5.5
- Relevant für tokenintensive Workloads
Deepseek hat den 75%-Rabatt auf sein Spitzenmodell DeepSeek‑V4‑Pro dauerhaft gemacht – eine Aktion, die ursprünglich am 31. Mai 2026 enden sollte. Die Folge: starke Preisdruckeffekte im Markt, weil das Unternehmen die Kosten für Entwickler deutlich senkt und die Hürde zur Migration reduziert.
Was genau passiert ist
Deepseek hat die Rabattaktion auf DeepSeek‑V4‑Pro in eine permanente Preisgestaltung überführt. Ziel der Maßnahme ist laut Ankündigung, Entwickler durch sehr niedrige Preise zum Umstieg zu bewegen. Um die Migration zu erleichtern, unterstützen Deepseek‑Modelle sowohl das OpenAI‑ als auch das Anthropic‑API‑Format.
Preise (pro 1 Million Tokens)
- DeepSeek‑V4‑Pro: Input $0,435; Input bei Cache‑Treffern $0,003625; Output $0,87
- DeepSeek‑V4‑Flash: Input $0,14; Input Cache $0,0028; Output $0,28
- GPT‑5.5: Input $5,00; Input Cache $0,50; Output $30,00
- GPT‑5.5 (Long Context, >270k): Input $10,00; Input Cache $1,00; Output $45,00
- Opus 4.7: Input $5,00; Input Cache $0,50; Output $25,00
Was diese Zahlen bedeuten
Token sind die Abrechnungseinheit (etwa Wörter oder Wortteile), das Kontextfenster beschreibt, wie viel Text ein Modell gleichzeitig verarbeiten kann. Deepseek‑Modelle bieten ein Kontextfenster von bis zu einer Million Tokens und bis zu 384.000 Output‑Tokens. Dank der neuen Preise ist DeepSeek‑V4‑Pro beim Input rund elfmal günstiger als GPT‑5.5 und beim Output mindestens rund 35‑mal günstiger. V4‑Flash liegt noch unterhalb dieser Werte. Cache‑Treffer können die Input‑Kosten pro Token zusätzlich drastisch senken.
Warum reine Token‑Preise nicht alles sind
Der reine Preis pro Token ist nur ein Teil der Rechnung. Entscheidend ist auch, wie viele Tokens ein Modell pro Aufgabe verbraucht. Ein günstiger Tokenpreis nutzt wenig, wenn das Modell deutlich mehr Tokens benötigt als ein Konkurrent. Beispiele aus dem Markt: Googles Gemini Flash 3.5 verbraucht in der Praxis mehr Tokens als sein Vorgänger; auch Opus 4.7 zieht mehr Tokens als frühere Versionen. GPT‑5.5 wiederum benötigt weniger Tokens als GPT‑5.4. Insgesamt zeigen Beobachtungen, dass viele aktuelle Modelle gegenüber ihren Vorgängern in der Praxis 30–90 % teurer ausfallen können.
Auswirkungen auf Unternehmen und Markt
Deepseek scheint in der aktuellen Phase weniger umsatzgetrieben aufzutreten als Anbieter wie OpenAI oder Anthropic, die beide einen Börsengang anstreben. Das erlaubt Deepseek, aggressiver preislich aufzutreten. Für Unternehmen bedeutet das: Bei Anwendungen mit hohem Token‑Verbrauch — etwa agentischen Systemen oder großen Dokumenten‑Workflows — gewinnt der Preis pro Token stark an Gewicht. In solchen Fällen kann es für Firmen wirtschaftlich sinnvoll sein, das günstigere Modell zu wählen, das für die jeweilige Aufgabe „gut genug“ arbeitet.
Einordnung
Leistungsmäßig ordnet sich DeepSeek‑V4 hinter Frontier‑Modellen wie GPT‑5.5 oder Opus 4.7 ein; wie groß der praktische Qualitätsunterschied bei konkreten Aufgaben ist, muss sich bei Tests zeigen. Preislich ist der Vorteil von Deepseek deutlich ausgeprägt, was dem Anbieter potenziell Marktanteile verschaffen kann.
Quellenangabe
Quellen
- Quelle: Deepseek / OpenAI / Anthropic
- Der ursprüngliche Artikel wurde hier veröffentlicht
- Dieser Artikel wurde im Podcast KI-Briefing-Daily behandelt. Die Folge kannst du hier anhören.




