DeepSeek V4, veröffentlicht am 24. April 2026 unter der MIT-Lizenz, machte ein vertrautes Versprechen konkret: offene Gewichte, die auf den Benchmarks, die Entwicklern wichtig sind, statistisch mit aktuellen geschlossenen Flaggschiffen gleichauf liegen. Claude Fable 5, veröffentlicht am 9. Juni 2026, antwortete aus der entgegengesetzten Richtung: ein Modell der Mythos-Klasse, das die Obergrenze höher schiebt als jedes allgemein verfügbare System zuvor. Sie streiten eigentlich nicht um dieselben Käufer - doch fast jedes Team muss jetzt entscheiden, wie es die Arbeit zwischen diesen beiden Philosophien aufteilt.
Kurzes Fazit
DeepSeek V4 gewinnt bei Oekonomie, Offenheit und Volumen: Coding nahe der Spitze zu ein bis zwei Prozent der Spitzenpreise, Gewichte, die man herunterladen, feinabstimmen und selbst hosten kann. Claude Fable 5 gewinnt bei der Obergrenze: die längsten autonomen Agentenläufe, das schwerste Reasoning, Spitzen-Vision und Finanzanalyse sowie eine Enterprise-Vertrauensgeschichte mit expliziter Sicherheitsmechanik. Die meisten anspruchsvollen Stacks 2026 nutzen ein offenes Arbeitspferd für die vielen und ein Spitzenmodell für die wenigen Aufgaben - diese Paarung ist der Archetyp.
Wählen Sie DeepSeek V4, wenn
- Kosten dominieren: V4-Pro für 0,435 $/0,87 $ pro Million Token (mit Cache-Hit-Input für 0,003625 $) ist beim Input rund 23x und beim Output rund 57x günstiger als Fable 5.
- Sie wettbewerbsfähiges Coding wollen: 80,6 % bei SWE-bench Verified (die höchste Open-Weights-Wertung, gleichauf mit Gemini 3.1 Pro), 93,5 bei LiveCodeBench, Codeforces-ELO 3206 - vor GPT-5.5s 3168.
- Sie Kontrolle brauchen: MIT-lizenzierte Gewichte auf Hugging Face, Self-Hosting, Feinabstimmung und volle Datenhoheit.
- Sie enorme Ausgaben erzeugen - V4 unterstützt bis zu 384k Ausgabe-Token, das Dreifache von Fable 5s 128k.
Wählen Sie Claude Fable 5, wenn
- Ihre Aufgaben an der Spitze liegen: Spitzenniveau bei nahezu allen von Anthropic getesteten Benchmarks, die höchste FrontierCode-Wertung unter den Spitzenmodellen und das beste Ergebnis aller Modelle beim Hebbia-Finanz-Benchmark.
- Agenten stundenlange autonome Arbeit überstehen müssen - Fable 5 läuft länger als jedes bisherige Claude, mit Gedächtnisgewinnen von etwa dem 3-Fachen von Opus 4.8.
- Sie verwaltete Enterprise-Infrastruktur brauchen: SLAs auf der Claude API, AWS Bedrock, Google Cloud und Microsoft Foundry, plus strukturierte Ablehnungen mit kostenlosen Wiederholungen und Fallback-Guthaben.
- Vision zählt: Fable 5 ist Anthropics Spitzenmodell für bildlastige Arbeit; V4s Stärken konzentrieren sich auf Text und Code.
Auf einen Blick
| Merkmal | Claude Fable 5 | DeepSeek V4-Pro | DeepSeek V4-Flash |
|---|---|---|---|
| Lizenz | Proprietäre API | Open Weights, MIT (Hugging Face) | |
| Architektur | Nicht offengelegt | MoE, 1,6T gesamt / 49B aktive Parameter | MoE, 284B gesamt / 13B aktiv |
| Kontextfenster | 1M Token | 1M Token (Standard) | |
| Maximale Ausgabe | 128k Token | 384k Token | |
| API-Preis (pro 1M Token) | 10 $ / 50 $ | 0,435 $ / 0,87 $ (Cache-Hit-Input 0,003625 $) | 0,14 $ / 0,28 $ |
| SWE-bench Verified | Spitzenniveau (Anthropic meldet SOTA bei nahezu allen getesteten Benchmarks) | 80,6 % - höchste Open-Weights-Wertung | Niedriger, auf Geschwindigkeit getrimmt |
| Codeforces-ELO | Nicht veröffentlicht | 3206 (über GPT-5.5s 3168) | - |
| Self-Hosting / Feinabstimmung | Nein | Ja - volle Gewichte, kommerzielle Nutzung erlaubt | |
| Vision | Spitzenniveau | Begrenzter Fokus | |
| Sicherheitsmechanik | Klassifikatoren + strukturierte Ablehnungen + Fallback | Keine integriert - Sie verantworten Alignment und Filterung | |
Die Oekonomie, ehrlich betrachtet
Das rohe Vielfache ist verblüffend - 23x bis 57x -, doch der ehrliche Vergleich schließt ein, was der API-Preis nicht zeigt:
- Volumenarbeit: Für Klassifikation, Extraktion, Routine-Entwürfe und Coding mittlerer Komplexität im großen Maßstab ist V4 (oder V4-Flash für 0,14 $/0,28 $) so günstig, dass die Qualität pro Dollar unschlagbar ist. Dasselbe Volumen über Fable 5 laufen zu lassen, ist ökonomisch nicht zu rechtfertigen.
- Realitätscheck Self-Hosting: Kostenlose Gewichte sind keine kostenlose Inferenz. V4-Pro aktiviert 49B Parameter pro Token aus einem 1,6T-MoE - es gut zu betreiben, erfordert ernsthafte Multi-GPU-Infrastruktur, MLOps-Zeit und Kapazitätsplanung. Unterhalb von dauerhaft hohem Volumen schlägt DeepSeeks eigene API (oder ein gehosteter Anbieter) das Self-Hosting bei den echten Kosten.
- Oekonomie des Scheiterns: Bei Obergrenz-Aufgaben kostet ein günstiges Modell, das zweimal scheitert und dann einen Entwickler braucht, mehr als ein Premium-Modell, das einmal gelingt. Der Preis pro Token ist nicht der Preis pro Ergebnis.
Benchmarks gegen die Obergrenze
DeepSeek V4s Zahlen verdienen Respekt: 80,6 % bei SWE-bench Verified liegen gleichauf mit Gemini 3.1 Pro und statistisch auf Augenhöhe mit Claude Opus 4.7 (80,8 %) - einem geschlossenen Flaggschiff von nur wenigen Monaten zuvor. Seine Codeforces-Wertung von 3206 schlägt GPT-5.5 bei Wettbewerbsprogrammierung glatt. Der offene Befund: Open Source erreicht jetzt die vorherige Spitzen-Generation.
Fable 5 definiert die aktuelle. Anthropic meldet Spitzenergebnisse bei nahezu allen getesteten Benchmarks, die höchste FrontierCode-Wertung unter den Spitzenmodellen selbst bei mittlerem effort, das beste Hebbia-Finanzergebnis aller Modelle und Spitzen-Vision. Wo die Lücke praktisch statt statistisch wird, ist die Ausdauer: Stripes Ruby-Migration mit 50 Millionen Zeilen, von Monaten auf Tage verkürzt, ist genau die Art langhorizontiger, hochkohärenter Arbeit, bei der noch kein offenes Modell mithält - V4s Stärken sind aufgabenbezogen, Fable 5s summieren sich über Stunden.
Datenschutz, Datenhoheit und Vertrauen - zwei Philosophien
Das ist der tiefste Unterschied. DeepSeek bietet Kontrolle: MIT-Gewichte bedeuten, dass Ihre Daten vollständig auf Ihrer Hardware bleiben können, feinabgestimmt auf Ihre Domäne, auf Gewichtsebene prüfbar - entscheidend für abgeschottete Umgebungen, strenge Datenresidenz-Regime und alle, die vorsichtig sind, Kronjuwelen-Code an Dritte zu senden (manche Organisationen wiegen bei der Nutzung der gehosteten API auch die Geopolitik eines in China ansässigen Anbieters ab - Self-Hosting umgeht das vollständig). Sie erben zudem die gesamte Verantwortung: Alignment, Jailbreak-Resistenz und Missbrauchsschutz liegen bei Ihnen.
Anthropic bietet Rechenschaft: Fable 5 wird mit Sicherheitsklassifikatoren ausgeliefert (die in unter 5 % der Sitzungen auslösen), strukturierten Ablehnungen, die nichts kosten, dokumentiertem Fallback auf Opus 4.8, einer 30-tägigen Speicherrichtlinie ohne Training auf API-Daten - und einer Erfolgsbilanz beim Handeln unter Druck, nachdem das Modell binnen Tagen nach einer entdeckten Exploit-Umgehung pausiert und am 1. Juli 2026 mit einem Klassifikator wieder bereitgestellt wurde, der diese Umgehung in über 99 % der Fälle blockiert, plus einem öffentlichen HackerOne-Bounty. Keine Philosophie ist strikt sicherer; sie legen das Vertrauen in verschiedene Hände.
Für Einsteiger
Wenn Sie einen Chat-Assistenten statt einer API wählen, lautet die praktische Antwort: DeepSeeks Apps sind kostenlos bis sehr günstig und beeindruckend fähig für Fragen, Schreiben und Lernhilfe; Claudes kostenpflichtige Tarife erkaufen Ihnen das stärkste verfügbare Reasoning überhaupt plus ausgefeilte Dokumentverarbeitung. Starten Sie bei beiden kostenlos. Wenn Sie feststellen, dass Sie lange Dokumente einfügen, mehrstufige Projekte jonglieren oder den Antworten für Arbeitsentscheidungen vertrauen, ist das der Moment, in dem das Claude-Upgrade seinen Preis verdient.
Für Entwickler: das Router-Muster
Der Konsens-Stack 2026 behandelt diese zwei als Schichten, nicht als Rivalen: Leiten Sie gut spezifizierte Aufgaben mit hohem Volumen an V4 (gehostet oder selbst gehostet), eskalieren Sie langhorizontige Agenten und Obergrenz-Aufgaben zu Fable 5 und protokollieren Sie genug, um zu bemerken, wenn eine Aufgabenklasse auf der günstigen Stufe zu scheitern beginnt. Beachten Sie die Integrationsasymmetrien: Fable 5 erfordert Ablehnungsbehandlung (stop_reason "refusal") und stets aktives adaptives thinking mit nur zusammengefasstem Reasoning; V4 erfordert, dass Sie Ihre eigenen Leitplanken mitbringen und, beim Self-Hosting, eine Inferenzplattform für ein MoE mit 1,6T Parametern. Kalkulieren Sie Engineering-Zeit für die Last ein, die Sie wählen - es gibt so oder so eine.
Häufige Fehler
- Token-Preise statt Ergebnis-Preise vergleichen: Ein 57x günstigeres Modell, das die Aufgabe nicht abschließen kann, ist unendlich teurer.
- Annehmen, Self-Hosting sei kostenlos: GPUs, Betrieb und Auslastungsrisiko übersteigen unterhalb ernsthafter Größenordnung oft die API-Rechnungen.
- Spitzenarbeit per Richtlinie an die günstige Stufe schicken: Überprüfen Sie das Routing monatlich - beide Familien bewegen sich schnell.
- Ausgabelimits in die andere Richtung ignorieren: V4s 384k Ausgabe-Token schlagen Fable 5s 128k bei riesigen Single-Shot-Generierungen - manchmal ist das offene Modell das einzige, das die Aufgabe schafft.
- Leitplanken bei offenen Modellen auslassen: V4 wird ohne Sicherheitsklassifikatoren ausgeliefert; der Produktionseinsatz braucht Ihre eigene Filterschicht.
Abschließende Empfehlung
DeepSeek V4 ist das beste Open-Weights-Modell der Jahresmitte 2026 und der naheliegende ökonomische Standard für den Großteil der KI-Workloads - besonders da die MIT-Lizenz die Kontrolle absolut macht. Claude Fable 5 ist die Obergrenze: Wenn die Aufgabe lang, schwer, visuell oder geschäftskritisch ist, ist es derzeit unerreicht, und sein verwaltetes Vertrauensmodell ist das, was Unternehmen tatsächlich kaufen. Betreiben Sie das Arbeitspferd, mieten Sie den Spezialisten und prüfen Sie Preise und Benchmarks erneut in den offiziellen Quellen unten - diese Paarung ändert sich schneller als jede andere in der KI.
Weiterlesen
Quellen
- Anthropic - Ankündigung von Claude Fable 5 und Claude Mythos 5
- Claude Platform Docs - Modellübersicht und Preise
- DeepSeek API Docs - DeepSeek V4 Release
- Hugging Face - deepseek-ai/DeepSeek-V4-Pro (MIT-Gewichte)
- DataCamp - DeepSeek V4: Funktionen, Benchmarks, Vergleiche
- Morph - DeepSeek V4: 1,6T MoE, 1M Kontext, Architektur und Preise
- Anthropic - Erneute Bereitstellung von Claude Fable 5
- AWS - Claude Fable 5 auf Amazon Bedrock

