Das ist gerade die spannendste Rivalität in der KI: Anthropic liefert ein außergewöhnliches Modell, Google liefert ein Oekosystem. Claude Fable 5 (veröffentlicht am 9. Juni 2026) sitzt oberhalb von Anthropics Opus-Klasse und ist bei nahezu jedem von Anthropic getesteten Benchmark auf Spitzenniveau. Gemini kontert nicht mit einem Modell, sondern mit einem Portfolio, das vom Budget- bis zum Premiumsegment reicht und in Search, Workspace, Android und Google Cloud eingebunden ist. Beide Wege führen zu Spitzenfähigkeit - der Unterschied liegt darin, wie man sie kauft und wo sie läuft.
Kurzes Fazit
Claude Fable 5 ist die Wahl, wenn Sie das einzelne leistungsfähigste allgemein verfügbare Modell brauchen: die längsten autonomen Agentenläufe, Coding-Ausdauer an der Spitze und sorgfältiges Reasoning über riesige Eingaben zu einem festen Preis. Gemini ist die Wahl, wenn Preis-Leistung, Multimodalität über den Google-Stack hinweg oder das mit 2M Token größte Kontextfenster der Branche (Gemini 3 Ultra) wichtiger sind, als die letzten Punkte an Fähigkeit herauszuquetschen.
Wählen Sie Claude Fable 5, wenn
- Ihre Agenten stundenlang laufen müssen, ohne den Zusammenhang zu verlieren - Fable 5 arbeitet länger autonom als jedes bisherige Claude, mit Gedächtnisgewinnen von etwa dem 3-Fachen von Opus 4.8 in Evaluationen über lange Zeithorizonte.
- Sie die Spitzenwerte dort wollen, wo es zählt: höchste Wertung unter den Spitzenmodellen bei Cognitions FrontierCode (selbst bei mittlerem effort) und die höchste Wertung aller Modelle beim Hebbia-Finanz-Benchmark.
- Sie berechenbares Engineering-Verhalten brauchen: feste Preise von 10 $/50 $ über das gesamte 1M-Kontextfenster, maschinenlesbare Ablehnungen, kostenlose abgelehnte Anfragen und integrierten Fallback.
Wählen Sie Gemini, wenn
- Sie die Kosten pro Intelligenzeinheit optimieren: Gemini 3.1 Pro für 2 $/12 $ pro Million Token kostet etwa ein Fünftel von Fable 5 und führte bei seinem Start 13 von 16 verfolgten Benchmarks an.
- Sie mehr als 1M Token Kontext brauchen: Gemini 3 Ultra bietet ein 2M-Token-Fenster - das größte jedes kommerziellen Spitzenmodells - für 10 $/30 $.
- Ihre Organisation in Google Workspace lebt oder Sie Verbrauchertarife wollen (Google AI Pro für 19,99 $/Monat, AI Ultra ab 99,99 $/Monat), eingebunden in Gmail, Docs und Android.
- Sie eine günstige, schnelle Agentenstufe wollen: Gemini 3.5 Flash (1,50 $/9 $) erreicht 76,2 % bei Terminal-bench 2.1 und 55,1 % bei SWE-Bench Pro - bemerkenswert für seine Preisklasse.
Auf einen Blick
| Merkmal | Claude Fable 5 | Gemini 3.1 Pro | Gemini 3 Ultra |
|---|---|---|---|
| Rolle | Einzelnes Flaggschiff der Mythos-Klasse | Preis-Leistungs-Flaggschiff | Premium, größter Kontext |
| Kontextfenster | 1M Token | 1M Token | 2M Token |
| Maximale Ausgabe | 128k Token | Modellabhängig | Modellabhängig |
| API-Preis (pro 1M Token) | 10 $ / 50 $ | 2 $ / 12 $ (Prompts bis 200k) | 10 $ / 30 $ |
| Kennzeichnende Stärke | Agentenausdauer, Coding an der Spitze, sorgfältiges Reasoning | Preis-Leistung, GPQA-Diamond-Rekord von 94,3 % | Größtes kommerzielles Kontextfenster |
| Reasoning | Adaptives thinking immer aktiv + effort-Steuerung | Konfigurierbares thinking | Stufe für tiefes Reasoning |
| Oekosystem | Claude API, AWS Bedrock, Google Cloud, Microsoft Foundry, Claude Code | Google AI Studio, Vertex AI, Workspace, Android, Search | |
| Datenspeicherung (API) | 30 Tage, nicht für Training genutzt | Konfigurierbar über Google-Cloud-Kontrollen | |
Preise: ein fester Tarif vs eine Leiter
Anthropics Verkaufsargument ist Einfachheit: 10 $ rein, 50 $ raus, die volle Million Token, keine Stufen. Googles Verkaufsargument ist Auswahl: Flash für 1,50 $/9 $ für hohes Volumen, 3.1 Pro für 2 $/12 $ für die meiste Arbeit, Ultra für 10 $/30 $, wenn Sie das 2M-Fenster brauchen. Drei praktische Beobachtungen:
- Für alltäglichen API-Traffic ist Gemini 3.1 Pro drastisch günstiger - etwa 5x beim Input und 4x beim Output gegenüber Fable 5. Wenn Ihre Aufgaben keine Tiefe der Mythos-Klasse brauchen, summiert sich dieser Unterschied schnell.
- Für ausgabelastige Arbeit (lange Berichte, Codegenerierung) sei angemerkt: Ultras Output-Tarif von 30 $ unterbietet Fable 5s 50 $ und bietet dabei den doppelten Kontext.
- Für die schwersten 10 % - mehrstündige Agenten, verzwickte Refactorings, folgenreiche Analysen - amortisiert sich Fable 5s Aufpreis pro Token oft durch weniger Wiederholungen und weniger menschliche Nacharbeit. Ein gescheiterter 2-$-Lauf kostet mehr als ein erfolgreicher für 10 $.
Benchmarks und Praxisergebnisse
Auf dem Papier liefern sich die beiden ein Kopf-an-Kopf-Rennen. Gemini 3.1 Pro hält die höchste je erzielte GPQA-Diamond-Wertung (94,3 %) und führte bei seinem Start 13 von 16 verfolgten Benchmarks an. Fable 5 ist bei nahezu allen von Anthropic getesteten Benchmarks auf Spitzenniveau, führt bei Cognitions FrontierCode unter den Spitzenmodellen selbst bei mittlerem effort und hält die höchste Wertung aller Modelle beim Hebbia-Finanz-Benchmark. Anthropic meldet es zudem als Spitzenreiter bei Vision-Aufgaben.
Praxissignale zählen womöglich mehr als Ranglisten. Stripe nutzte Fable 5, um eine Ruby-Migration mit 50 Millionen Zeilen von Monaten auf Tage zu verkürzen. Auf der Gemini-Seite zeigen die 76,2 % von 3.5 Flash bei Terminal-bench 2.1, dass Google agentische Fähigkeit in seine günstigste Stufe drängt - eine andere Philosophie: Anthropic bündelt die Spitzenfähigkeit in einem Modell, Google verteilt starke Fähigkeit über eine Familie.
Kontextfenster: 1M vs 2M
Fable 5s 1M-Token-Fenster (rund 555k Wörter) deckt nahezu jeden praktischen Workload ab: ganze Codebasen, Hunderte Dokumente, Wochen an Transkripten. Eine Feinheit, die Technikfans kennen sollten: Fable 5 verwendet den mit Opus 4.7 eingeführten Tokenizer, der für denselben Text rund 30 % mehr Token erzeugt als Claude-Modelle vor 4.7 - kalkulieren Sie entsprechend. Gemini 3 Ultras 2M-Fenster ist der Notausgang, wenn selbst das nicht reicht: komplette Datenräume, riesige Prozessunterlagen, mehrere Repositorys auf einmal. Wenn Ihre Arbeit wirklich eine Million Token pro Anfrage übersteigt, ist Gemini Ultra derzeit die einzige kommerzielle Antwort; das verzögerte Gemini 3.5 Pro soll voraussichtlich 2M in die Mittelklasse bringen, sobald es erscheint.
Für Einsteiger
Als täglicher Assistent sind beide hervorragend, und der entscheidende Faktor ist der Lebensraum. Wenn Ihr Leben über Gmail, Docs, Drive und Android läuft, setzen Geminis Verbrauchertarife für 19,99 $/Monat einen starken Assistenten direkt in diese Werkzeuge. Wenn Sie das stärkste verfügbare Reasoning in einer aufgeräumten Chat-Oberfläche wollen - zum Schreiben, Lernen, Analysieren und für Coding-Hilfe -, ist Claude mit Fable-5-Zugang die leistungsstärkere Maschine. Probieren Sie beide kostenlosen Stufen an denselben drei Aufgaben aus Ihrer tatsächlichen Woche aus; behalten Sie die, deren Antworten Sie weniger bearbeitet haben.
Für Entwickler und Profis
Die Integrationsdetails unterscheiden sich stärker, als das Marketing vermuten lässt. Fable 5 hält adaptives thinking stets aktiv (Sie stellen die Tiefe über den effort-Parameter ein, und die rohe Gedankenkette wird nie zurückgegeben), unterstützt das memory tool, Codeausführung, programmatisches Tool Calling und Compaction und gibt Ablehnungen als strukturierte stop_reason-Werte mit kostenlosen Wiederholungen nachgelagert zurück. Geminis Vertex-AI-Stack bietet granulare Endpunktsteuerung (global, multiregional, regional), enge Anbindungen an BigQuery und Workspace sowie den Komfort eines einzigen Anbieters vom Data Warehouse bis zum Modell. Teams, die bereits auf Google Cloud sind, können sogar beide Seiten kombinieren: Claude-Modelle, einschließlich Fable 5, sind über Google Cloud neben Gemini verfügbar - das Router-Muster braucht also nur eine Cloud-Rechnung.
Sicherheit und Governance
Fable 5 wird mit Sicherheitsklassifikatoren ausgeliefert, die bestimmte Anfragen ablehnen (im Schnitt unter 5 % der Sitzungen, meist Themen der Cybersicherheit und Biologie), auf Opus-4.8-Antworten zurückfallen, mit einer 30-tägigen Speicherrichtlinie und ohne Training auf API-Traffic. Seine Exportkontroll-Pause im Juni 2026 und die erneute Bereitstellung am 1. Juli - mit einem neuen Klassifikator, der den gemeldeten Jailbreak in über 99 % der Fälle blockiert, plus einem HackerOne-Bounty-Programm - machten seine Sicherheitslage ungewöhnlich transparent. Google stützt sich auf die Unternehmens-Governance von Vertex AI: Organisationsrichtlinien, Datenresidenz über regionale Endpunkte und Admin-Kontrollen auf Workspace-Niveau. Regulierte Branchen finden bei beiden brauchbare Antworten, ausgedrückt in verschiedenen Sprachen: Anthropic spricht von Garantien auf Modellebene, Google von Kontrollen auf Cloud-Ebene.
Häufige Fehler
- Standardmäßig den größten Kontext kaufen: Die meisten Retrieval-Augmented-Setups schlagen brachiale 2M-Token-Prompts zu einem Bruchteil der Kosten. Greifen Sie zu Ultra, wenn Sie es wirklich brauchen.
- Die Tokenizer-Aenderung ignorieren: Fable 5 zählt für denselben Text rund 30 % mehr Token als ältere Claude-Modelle - aktualisieren Sie Ihre Budgets bei der Migration.
- Eine Rangliste als Wahrheit behandeln: GPQA misst wissenschaftliche Fragen, FrontierCode misst Engineering - wählen Sie Benchmarks, die die Form Ihrer Arbeit haben.
- Modelle der Flash-Klasse unterschätzen: Für einfache Aufgaben mit hohem Volumen schlägt Gemini 3.5 Flash für 1,50 $/9 $ oft den Einsatz eines Flaggschiffs überhaupt.
- Anbieterbindung aus Trägheit: Beide sind auf Google Cloud - testen Sie sie nebeneinander, bevor Sie sich festlegen.
Abschließende Empfehlung
Wählen Sie Claude Fable 5 als Ihr Spitzenmodell: Es ist die stärkste allgemein verfügbare KI der Jahresmitte 2026, mit einer Agentenausdauer und einem Engineering-Verhalten, das keine Gemini-Stufe vollständig erreicht. Wählen Sie Gemini als Ihre Flotte: 3.1 Pro für exzellenten und günstigen Standard-Traffic, Flash für Volumen, Ultra, wenn 2M Token die Anforderung sind. Die stärksten Teams, die wir sehen, fahren genau diese Aufteilung - Gemini-Oekonomie für die vielen, Fable-5-Feuerkraft für die wenigen Aufgaben, die das Quartal entscheiden.
Weiterlesen
Quellen
- Anthropic - Ankündigung von Claude Fable 5 und Claude Mythos 5
- Claude Platform Docs - Modellübersicht und Preise
- Google AI for Developers - Gemini API Modelle
- TokenCost - Gemini 3 API-Preise: Ultra, Pro, Flash im Vergleich (2026)
- eesel AI - Google Gemini 3 Preise 2026: Tarife, Modelle und API-Kosten
- Anthropic - Erneute Bereitstellung von Claude Fable 5
- AWS - Claude Fable 5 auf Amazon Bedrock
- Tech Insider - Gemini 3.5 Pro verschiebt sich auf Juli 2026

