C'est la rivalité la plus intéressante de l'IA en ce moment : Anthropic livre un modèle extraordinaire, Google livre un écosystème. Claude Fable 5 (sorti le June 9, 2026) se situe au-dessus de la classe Opus d'Anthropic et est à l'état de l'art sur presque tous les benchmarks testés par Anthropic. Gemini réplique non pas avec un seul modèle mais avec un portefeuille dont les prix vont de l'entrée de gamme au premium, relié à Search, Workspace, Android et Google Cloud. Les deux voies mènent à une capacité de pointe : la différence tient à la façon de l'acheter et à l'endroit où elle s'exécute.
Verdict rapide
Claude Fable 5 s'impose quand vous avez besoin du modèle le plus performant disponible pour tous : les plus longues exécutions d'agents, une endurance de codage de pointe et un raisonnement soigné sur d'énormes entrées à prix fixe. Gemini s'impose quand le rapport prix-performance, la multimodalité sur toute la pile Google ou la plus grande fenêtre de contexte du secteur (2M de tokens sur Gemini 3 Ultra) comptent plus que de gratter les derniers points de capacité.
Choisissez Claude Fable 5 si
- Vos agents doivent tourner des heures sans perdre en cohérence : Fable 5 travaille de façon autonome plus longtemps que tout Claude précédent, avec des gains de mémoire valant à peu près 3x ceux d'Opus 4.8 dans les évaluations au long cours.
- Vous voulez les meilleurs scores là où ça compte : le meilleur parmi les modèles de pointe sur le FrontierCode de Cognition (même à effort moyen) et le meilleur score de tous les modèles sur le benchmark finance de Hebbia.
- Vous avez besoin d'un comportement d'ingénierie prévisible : tarification fixe de 10 $/50 $ sur tout le contexte d'1M, refus lisibles par une machine, requêtes refusées gratuites et repli intégré.
Choisissez Gemini si
- Vous optimisez le coût par unité d'intelligence : Gemini 3.1 Pro à 2 $/12 $ par million de tokens représente environ un cinquième du prix de Fable 5 et a dominé 13 des 16 benchmarks suivis à son lancement.
- Vous avez besoin de plus d'1M de tokens de contexte : Gemini 3 Ultra offre une fenêtre de 2M de tokens, la plus grande de tout modèle de pointe commercial, à 10 $/30 $.
- Votre organisation vit dans Google Workspace, ou vous voulez des offres grand public (Google AI Pro à 19,99 $/mois, AI Ultra à partir de 99,99 $/mois) reliées à Gmail, Docs et Android.
- Vous voulez un palier d'agent bon marché et rapide : Gemini 3.5 Flash (1,50 $/9 $) obtient 76,2% sur Terminal-bench 2.1 et 55,1% sur SWE-Bench Pro, remarquable pour sa gamme de prix.
En un coup d'oeil
| Caractéristique | Claude Fable 5 | Gemini 3.1 Pro | Gemini 3 Ultra |
|---|---|---|---|
| Rôle | Fer de lance unique de classe Mythos | Fer de lance au bon rapport qualité-prix | Premium, plus grand contexte |
| Fenêtre de contexte | 1M de tokens | 1M de tokens | 2M de tokens |
| Sortie maximale | 128k tokens | Selon le modèle | Selon le modèle |
| Tarif API (par 1M de tokens) | 10 $ / 50 $ | 2 $ / 12 $ (prompts jusqu'à 200k) | 10 $ / 30 $ |
| Point fort distinctif | Endurance des agents, codage de pointe, raisonnement soigné | Rapport prix-performance, record de 94,3% au GPQA Diamond | Plus grande fenêtre de contexte commerciale |
| Raisonnement | Réflexion adaptative toujours active + contrôle par effort | Réflexion configurable | Palier de raisonnement approfondi |
| Écosystème | Claude API, AWS Bedrock, Google Cloud, Microsoft Foundry, Claude Code | Google AI Studio, Vertex AI, Workspace, Android, Search | |
| Conservation des données (API) | 30 jours, non utilisées pour l'entraînement | Configurable via les contrôles Google Cloud | |
Tarification : un tarif fixe unique contre une gamme
L'argument d'Anthropic, c'est la simplicité : 10 $ en entrée, 50 $ en sortie, le million de tokens complet, sans palier. L'argument de Google, c'est le choix : Flash à 1,50 $/9 $ pour le volume, 3.1 Pro à 2 $/12 $ pour l'essentiel du travail, Ultra à 10 $/30 $ quand vous avez besoin de la fenêtre de 2M. Trois observations pratiques :
- Pour le trafic API quotidien, Gemini 3.1 Pro est nettement moins cher, environ 5x en entrée et 4x en sortie par rapport à Fable 5. Si vos tâches n'exigent pas la profondeur de classe Mythos, cette différence s'accumule vite.
- Pour le travail à forte sortie (longs rapports, génération de code), notez que le tarif de sortie de 30 $ d'Ultra passe sous les 50 $ de Fable 5 tout en offrant deux fois plus de contexte.
- Pour les 10% les plus difficiles, agents sur plusieurs heures, refactorisations épineuses, analyses à fort enjeu, la surcote au token de Fable 5 se rentabilise souvent par moins de relances et moins de reprise humaine. Une exécution ratée à 2 $ coûte plus cher qu'une réussie à 10 $.
Benchmarks et résultats concrets
Sur le papier, les deux se rendent coup pour coup. Gemini 3.1 Pro détient le meilleur score GPQA Diamond jamais enregistré (94,3%) et a mené 13 des 16 benchmarks suivis à son lancement. Fable 5 est à l'état de l'art sur presque tous les benchmarks testés par Anthropic, domine le FrontierCode de Cognition parmi les modèles de pointe même à effort moyen, et détient le meilleur score de tous les modèles sur le benchmark finance de Hebbia. Anthropic le présente aussi comme l'état de l'art pour les tâches de vision.
Les signaux du terrain comptent peut-être plus que les classements. Stripe a utilisé Fable 5 pour comprimer une migration Ruby de 50 millions de lignes de plusieurs mois à quelques jours. Du côté de Gemini, les 76,2% de 3.5 Flash sur Terminal-bench 2.1 montrent que Google pousse la capacité agentique jusque dans son palier le moins cher, une philosophie différente : Anthropic concentre la capacité maximale dans un seul modèle, Google diffuse une forte capacité dans toute une famille.
Fenêtres de contexte : 1M contre 2M
La fenêtre d'1M de tokens de Fable 5 (environ 555k mots) couvre presque toutes les charges de travail concrètes : bases de code entières, centaines de documents, semaines de transcriptions. Une subtilité que les initiés devraient connaître : Fable 5 utilise le tokeniseur introduit avec Opus 4.7, qui produit à peu près 30% de tokens en plus pour le même texte que les modèles Claude antérieurs à la 4.7, prévoyez votre budget en conséquence. La fenêtre de 2M de Gemini 3 Ultra est la porte de sortie quand même cela ne suffit pas : data rooms complètes, énormes dossiers de contentieux, plusieurs dépôts à la fois. Si votre travail dépasse réellement le million de tokens par requête, Gemini Ultra est actuellement la seule réponse commerciale ; le Gemini 3.5 Pro retardé devrait apporter les 2M au palier intermédiaire à sa sortie.
Pour les débutants
Comme assistant au quotidien, les deux sont excellents et le facteur décisif est l'habitat. Si votre vie tourne sur Gmail, Docs, Drive et Android, les offres grand public de Gemini placent un assistant solide directement dans ces outils pour 19,99 $/mois. Si vous voulez le raisonnement le plus fort disponible dans une interface de chat épurée, pour l'écriture, l'étude, l'analyse et l'aide au code, Claude avec accès à Fable 5 est le moteur le plus puissant. Testez les deux offres gratuites sur les trois mêmes tâches de votre vraie semaine ; gardez celui dont vous avez le moins retouché les réponses.
Pour les développeurs et les experts
Les détails d'intégration diffèrent plus que ne le laisse penser le marketing. Fable 5 garde la réflexion adaptative toujours active (vous en réglez la profondeur via le paramètre effort, et le raisonnement brut n'est jamais renvoyé), prend en charge la memory tool, l'exécution de code, l'appel d'outils par programmation et la compaction, et renvoie les refus sous forme de valeurs stop_reason structurées avec des relances gratuites en aval. La pile Vertex AI de Gemini offre un contrôle granulaire des points de terminaison (global, multirégion, régional), une intégration étroite à BigQuery et Workspace, et le confort d'un fournisseur unique de l'entrepôt de données au modèle. Les équipes déjà sur Google Cloud peuvent même faire la synthèse : les modèles Claude, dont Fable 5, sont disponibles via Google Cloud aux côtés de Gemini, si bien que le schéma en routeur ne nécessite qu'une seule facture cloud.
Sécurité et gouvernance
Fable 5 est livré avec des classificateurs de sécurité qui refusent certaines requêtes (moins de 5% des sessions en moyenne, surtout sur les sujets de cybersécurité et de biologie), en repliant vers des réponses d'Opus 4.8, avec une politique de conservation de 30 jours et aucun entraînement sur le trafic API. Sa pause liée aux contrôles à l'exportation en June 2026 et son redéploiement le July 1, avec un nouveau classificateur bloquant le contournement signalé dans plus de 99% des cas plus un programme de primes HackerOne, ont rendu sa posture de sécurité inhabituellement transparente. Google s'appuie sur la gouvernance d'entreprise de Vertex AI : politiques d'organisation, résidence des données via des points de terminaison régionaux et contrôles d'administration de niveau Workspace. Les secteurs réglementés trouveront des réponses exploitables des deux côtés, exprimées dans des langages différents : Anthropic parle de garanties au niveau du modèle, Google parle de contrôles au niveau du cloud.
Erreurs fréquentes
- Acheter le plus grand contexte par défaut : la plupart des configurations à génération augmentée par récupération surpassent les prompts de 2M de tokens en force brute pour une fraction du coût. Réservez Ultra à quand vous en avez vraiment besoin.
- Ignorer le changement de tokeniseur : Fable 5 compte ~30% de tokens en plus que les anciens modèles Claude pour le même texte, mettez vos budgets à jour lors de la migration.
- Prendre un seul classement pour vérité : le GPQA mesure les questions-réponses scientifiques, le FrontierCode mesure l'ingénierie, choisissez des benchmarks à l'image de votre travail.
- Sous-estimer les modèles de classe Flash : pour les tâches simples en gros volume, Gemini 3.5 Flash à 1,50 $/9 $ surpasse souvent l'usage d'un quelconque fer de lance.
- La dépendance à un fournisseur par inertie : les deux sont sur Google Cloud, testez-les côte à côte avant de vous standardiser.
Recommandation finale
Choisissez Claude Fable 5 comme modèle de tête : c'est l'IA la plus forte disponible pour tous à la mi-2026, avec une endurance des agents et un comportement d'ingénierie qu'aucun palier de Gemini n'égale entièrement. Choisissez Gemini comme flotte : 3.1 Pro pour un trafic par défaut excellent et bon marché, Flash pour le volume, Ultra quand 2M de tokens sont l'exigence. Les meilleures équipes que nous voyons appliquent exactement cette répartition : l'économie de Gemini pour la masse, la puissance de feu de Fable 5 pour les rares tâches qui décident du trimestre.
À lire ensuite
Sources
- Anthropic - Annonce de Claude Fable 5 et Claude Mythos 5
- Claude Platform Docs - Aperçu des modèles et tarifs
- Google AI for Developers - Modèles de l'API Gemini
- TokenCost - Tarifs de l'API Gemini 3 : Ultra, Pro, Flash comparés (2026)
- eesel AI - Tarifs de Google Gemini 3 en 2026 : offres, modèles et coûts API
- Anthropic - Redéploiement de Claude Fable 5
- AWS - Claude Fable 5 sur Amazon Bedrock
- Tech Insider - Gemini 3.5 Pro repoussé à July 2026

