cyberivy
AIDeepSeekChinaHuawei AscendLLMInferenceKI-KostenOpen Weights2026

DeepSeek V4: Chinesisches KI-Modell unterbietet GPT-5.5 um 97 Prozent

3. Mai 2026

DeepSeek hat Ende April 2026 sein neues Sprachmodell V4 vorgestellt. Es läuft auf chinesischen Huawei-Ascend-Chips, hat ein Kontextfenster von einer Million Tokens und kostet bei der Eingabe nur einen Bruchteil dessen, was westliche Anbieter aufrufen.

Was DeepSeek V4 ist

DeepSeek hat am 24. April 2026 eine Vorschauversion seines Sprachmodells V4 vorgestellt. Es kommt in zwei Größen, V4-Pro und V4-Flash, und ist auf agentische Aufgaben, Wissensverarbeitung und Inferenz optimiert. Eine zentrale Neuerung ist ein hybrider Aufmerksamkeitsmechanismus, der zwei Verfahren kombiniert: Compressed Sparse Attention und Heavy Compressed Attention. Damit lässt sich ein Kontextfenster von einer Million Tokens nutzen, während laut DeepSeek 9,5- bis 13,7-mal weniger Speicher gegenüber V3.2 nötig ist.

Preisangriff auf US-Anbieter

Der größte Aufmerksamkeitspunkt ist der Preis. DeepSeek-V4-Pro startet bei rund 0,0036 US-Dollar pro Million gecachter Eingabe-Tokens. Zum Vergleich: OpenAIs GPT-5.5 verlangt für gecachte Eingabe-Tokens etwa 0,50 US-Dollar pro Million. Verschiedene Berichte sprechen daher von einem Preisvorteil von bis zu 97 Prozent gegenüber OpenAI-Modellen.

Huawei statt NVIDIA

V4 ist explizit für die Inferenz auf Huaweis Ascend-Supernode-Chips optimiert. Das ist mehr als ein technisches Detail. Es zeigt, dass China zunehmend einen vollständigen heimischen KI-Stack aufbaut, von der Chipfertigung über das Modell bis zur Anwendung. Damit reduziert sich die Abhängigkeit von US-Halbleitern wie denen von NVIDIA.

Warum das wichtig ist

Für Unternehmen weltweit verändert sich damit die Kostenrechnung von KI. Wenn Inferenz für agentische Workloads dauerhaft so günstig wird, sinkt die Eintrittshürde für Anwendungen, die heute aus Kostengründen nicht funktionieren würden, etwa Massen-Klassifikation, kontinuierliches Monitoring oder lange Recherchen.

Geopolitisch ist V4 ein Signal, dass der Vorsprung der USA bei Modellqualität nicht mehr automatisch ein Preis- oder Hardware-Vorteil ist. Für europäische Unternehmen heißt das, beim Einkauf von KI-Leistung sehr genau hinzusehen, auch in Sachen Datenhoheit, Sanktionen und Compliance.

Einfach erklärt am Beispiel

Ein mittelständischer Hersteller will jeden Tag automatisch tausende Kundenmails kategorisieren. Mit einem teuren US-Modell wäre das im Monat ein vierstelliger Betrag. Mit einem extrem günstigen Modell wie V4-Pro wird dieselbe Aufgabe rechnerisch um Größenordnungen billiger. Die Frage ist dann nicht mehr, ob KI sich lohnt, sondern welche Daten wo verarbeitet werden dürfen.

Was Entscheider beachten sollten

Vor jedem Einsatz steht die Datenschutz- und Sicherheitsprüfung. Anbieter aus China unterliegen anderen rechtlichen Rahmenbedingungen als US-Anbieter. Wer V4 oder ähnliche Modelle einsetzen will, sollte Vertragslage, Hosting-Ort und Auftragsverarbeitung sauber klären, bevor produktive Daten ins Spiel kommen.

💡 Im Klartext

Stell dir vor, ein neuer Bäcker macht Brot fast genauso gut wie der teuerste in der Stadt, verlangt dafür aber nur ein paar Cent. So ähnlich ist DeepSeek V4 für die KI-Welt. Es kommt aus China, läuft auf chinesischen Computern und ist viel billiger als die bekannten Konkurrenten aus den USA.

Wichtigste Erkenntnisse

  • DeepSeek hat V4 am 24. April 2026 als Vorschau veröffentlicht.
  • V4 kostet bei gecachter Eingabe rund 97 Prozent weniger als OpenAI GPT-5.5.
  • Das Modell unterstützt ein Kontextfenster von einer Million Tokens.
  • V4 ist speziell für Huawei-Ascend-Chips optimiert, nicht für NVIDIA.
  • Vor dem Einsatz sind Datenschutz- und Compliance-Fragen zu klären.

Häufige Fragen

Ist DeepSeek V4 Open Source?

DeepSeek-Modelle wurden bisher mit offenen Gewichten verfügbar gemacht. Für die genaue Lizenz von V4 sollte die offizielle Modellkarte geprüft werden.

Welcher Chip steht hinter V4?

V4 ist für Huaweis Ascend-Supernode-Inferenzplattform optimiert.

Wie schneidet V4 gegen US-Modelle ab?

DeepSeek bewirbt starke Leistung in agentischen Aufgaben und Wissensverarbeitung. Unabhängige Vergleiche mit GPT-5.5 stehen je nach Benchmark unterschiedlich aus.

Quellen & Kontext