DeepSeek V4, sorti le April 24, 2026 sous licence MIT, a concrétisé une promesse familière : des poids ouverts statistiquement à égalité avec les récents fers de lance fermés sur les benchmarks qui comptent pour les ingénieurs. Claude Fable 5, sorti le June 9, 2026, a répondu par la direction opposée : un modèle de classe Mythos qui pousse le plafond plus haut que tout système disponible pour tous auparavant. Ils ne se disputent pas vraiment les mêmes acheteurs, mais presque chaque équipe doit désormais décider comment répartir le travail entre ces deux philosophies.
Verdict rapide
DeepSeek V4 l'emporte sur l'économie, l'ouverture et le volume : un codage proche de la frontière à un ou deux pour cent des prix de pointe, des poids que vous pouvez télécharger, affiner et auto-héberger. Claude Fable 5 l'emporte sur le plafond : les plus longues exécutions d'agents autonomes, le raisonnement le plus difficile, la vision et l'analyse financière à l'état de l'art, et une histoire de confiance d'entreprise avec des mécanismes de sécurité explicites. La plupart des stacks sophistiquées de 2026 utilisent un cheval de trait ouvert pour la masse et un modèle de pointe pour les rares cas, cet appariement est l'archétype.
Choisissez DeepSeek V4 si
- Le coût domine : V4-Pro à 0,435 $/0,87 $ par million de tokens (avec l'entrée en cache-hit à 0,003625 $) est à peu près 23x moins cher en entrée et 57x moins cher en sortie que Fable 5.
- Vous voulez un codage compétitif : 80,6% sur SWE-bench Verified (le meilleur score en poids ouverts, à égalité avec Gemini 3.1 Pro), 93,5 sur LiveCodeBench, un ELO Codeforces de 3206, devant les 3168 de GPT-5.5.
- Vous avez besoin de contrôle : des poids sous licence MIT sur Hugging Face, l'auto-hébergement, l'affinage et une pleine souveraineté des données.
- Vous générez d'énormes sorties : V4 prend en charge jusqu'à 384k tokens de sortie, trois fois les 128k de Fable 5.
Choisissez Claude Fable 5 si
- Vos tâches se situent à la frontière : état de l'art sur presque tous les benchmarks testés par Anthropic, le meilleur score FrontierCode parmi les modèles de pointe et le meilleur résultat de tous les modèles sur le benchmark finance de Hebbia.
- Vos agents doivent survivre à des heures de travail autonome : Fable 5 tourne plus longtemps que tout Claude précédent, avec des gains de mémoire valant environ 3x ceux d'Opus 4.8.
- Vous avez besoin d'une plomberie d'entreprise gérée : des SLA sur Claude API, AWS Bedrock, Google Cloud et Microsoft Foundry, plus des refus structurés avec relances gratuites et crédit de repli.
- La vision compte : Fable 5 est le modèle à l'état de l'art d'Anthropic pour le travail riche en images ; les points forts de V4 se concentrent sur le texte et le code.
En un coup d'oeil
| Caractéristique | Claude Fable 5 | DeepSeek V4-Pro | DeepSeek V4-Flash |
|---|---|---|---|
| Licence | API propriétaire | Poids ouverts, MIT (Hugging Face) | |
| Architecture | Non divulguée | MoE, 1,6T paramètres au total / 49B actifs | MoE, 284B au total / 13B actifs |
| Fenêtre de contexte | 1M de tokens | 1M de tokens (par défaut) | |
| Sortie maximale | 128k tokens | 384k tokens | |
| Tarif API (par 1M de tokens) | 10 $ / 50 $ | 0,435 $ / 0,87 $ (entrée en cache-hit 0,003625 $) | 0,14 $ / 0,28 $ |
| SWE-bench Verified | Palier état de l'art (Anthropic rapporte le SOTA sur presque tous les benchmarks testés) | 80,6% - meilleur score en poids ouverts | Plus bas, réglé pour la vitesse |
| ELO Codeforces | Non publié | 3206 (au-dessus des 3168 de GPT-5.5) | - |
| Auto-hébergement / affinage | Non | Oui - poids complets, usage commercial autorisé | |
| Vision | État de l'art | Périmètre limité | |
| Mécanismes de sécurité | Classificateurs + refus structurés + repli | Aucun intégré - vous gérez l'alignement et le filtrage | |
L'économie, en toute honnêteté
Le multiple brut est saisissant, de 23x à 57x, mais la comparaison honnête inclut ce que le tarif de l'API ne montre pas :
- Travail en volume : pour la classification, l'extraction, la rédaction courante et le codage de complexité moyenne à grande échelle, V4 (ou V4-Flash à 0,14 $/0,28 $) est si bon marché que la qualité au dollar est imbattable. Faire passer le même volume par Fable 5 est économiquement indéfendable.
- Retour à la réalité de l'auto-hébergement : des poids gratuits ne sont pas une inférence gratuite. V4-Pro active 49B paramètres par token depuis un MoE de 1,6T, bien le servir demande une sérieuse infrastructure multi-GPU, du temps de MLOps et une planification de capacité. En dessous d'un fort volume soutenu, l'API de DeepSeek elle-même (ou un fournisseur hébergé) bat l'auto-hébergement sur le coût réel.
- Économie de l'échec : sur les tâches plafond, un modèle bon marché qui échoue deux fois puis nécessite un ingénieur coûte plus cher qu'un modèle premium qui réussit une fois. Le prix au token n'est pas le prix au résultat.
Benchmarks face au plafond
Les chiffres de DeepSeek V4 méritent le respect : 80,6% sur SWE-bench Verified égale Gemini 3.1 Pro et se situe statistiquement au niveau de Claude Opus 4.7 (80,8%), un fer de lance fermé de quelques mois plus tôt. Son Codeforces de 3206 bat GPT-5.5 nettement en programmation compétitive. Le constat franc : l'open source égale désormais la génération de pointe précédente.
Fable 5 définit la génération actuelle. Anthropic rapporte des résultats à l'état de l'art sur presque tous les benchmarks testés, le meilleur score FrontierCode parmi les modèles de pointe même à effort moyen, le meilleur résultat finance de Hebbia de tous les modèles, et une vision au SOTA. Là où l'écart devient pratique plutôt que statistique, c'est sur l'endurance : la migration Ruby de 50 millions de lignes de Stripe comprimée de plusieurs mois à quelques jours est le genre de travail au long cours et à forte cohérence où aucun modèle ouvert ne rivalise encore, les forces de V4 sont par tâche, celles de Fable 5 se cumulent sur des heures.
Confidentialité, souveraineté et confiance : deux philosophies
C'est la différence la plus profonde. DeepSeek offre le contrôle : des poids MIT signifient que vos données peuvent rester entièrement sur votre matériel, affinées pour votre domaine, auditables au niveau des poids, décisif pour les environnements isolés, les régimes stricts de résidence des données et quiconque hésite à envoyer du code stratégique à un tiers quelconque (certaines organisations pèsent aussi la géopolitique d'un fournisseur basé en Chine quand elles utilisent l'API hébergée, l'auto-hébergement l'évite entièrement). Vous héritez aussi de toute la responsabilité : l'alignement, la résistance au contournement et la prévention des abus sont à vous.
Anthropic offre la responsabilité : Fable 5 est livré avec des classificateurs de sécurité (se déclenchant dans moins de 5% des sessions), des refus structurés qui ne coûtent rien, un repli documenté vers Opus 4.8, une politique de conservation de 30 jours sans entraînement sur les données de l'API, et un bilan d'action sous pression, ayant mis le modèle en pause quelques jours après la découverte d'un contournement d'exploit et l'ayant redéployé le July 1, 2026 avec un classificateur bloquant ce contournement dans plus de 99% des cas plus une prime publique HackerOne. Aucune des deux philosophies n'est strictement plus sûre ; elles placent la confiance en des mains différentes.
Pour les débutants
Si vous choisissez un assistant de chat plutôt qu'une API, la réponse pratique : les applications de DeepSeek sont gratuites à très bon marché et remarquablement capables pour les questions, l'écriture et l'aide à l'étude ; les offres payantes de Claude vous achètent le raisonnement le plus fort disponible où que ce soit, plus une gestion documentaire soignée. Commencez gratuitement sur les deux. Si vous vous retrouvez à coller de longs documents, à jongler avec des projets en plusieurs étapes ou à vous fier aux réponses pour des décisions de travail, c'est le moment où la montée en gamme vers Claude justifie son prix.
Pour les ingénieurs : le schéma en routeur
La stack consensuelle de 2026 traite ces deux-là comme des couches, pas des rivaux : dirigez les tâches en gros volume et bien spécifiées vers V4 (hébergé ou auto-hébergé), faites monter les agents au long cours et les tâches plafond vers Fable 5, et journalisez assez pour repérer quand une classe de tâches commence à échouer sur le palier bon marché. Notez les asymétries d'intégration : Fable 5 exige la gestion des refus (stop_reason "refusal") et la réflexion adaptative toujours active avec un raisonnement uniquement résumé ; V4 exige que vous apportiez vos propres garde-fous et, en cas d'auto-hébergement, une plateforme d'inférence pour un MoE de 1,6T paramètres. Prévoyez du temps d'ingénierie pour le fardeau que vous choisissez, il y en a un dans les deux cas.
Erreurs fréquentes
- Comparer les prix au token au lieu des prix au résultat : un modèle 57x moins cher qui ne peut pas finir la tâche est infiniment plus cher.
- Supposer que l'auto-hébergement est gratuit : les GPU, les ops et le risque de sous-utilisation dépassent souvent les factures d'API en dessous d'une échelle sérieuse.
- Envoyer par principe le travail réservé à la frontière vers le palier bon marché : revoyez le routage chaque mois, les deux familles évoluent vite.
- Ignorer les limites de sortie dans l'autre sens : les 384k tokens de sortie de V4 battent les 128k de Fable 5 pour les générations massives en un seul coup, parfois le modèle ouvert est le seul qui convient à la tâche.
- Sauter les garde-fous sur les modèles ouverts : V4 est livré sans classificateurs de sécurité ; un usage en production nécessite votre propre couche de filtrage.
Recommandation finale
DeepSeek V4 est le meilleur modèle en poids ouverts de la mi-2026 et le choix économique évident pour le gros des charges de travail d'IA, surtout avec la licence MIT qui rend le contrôle absolu. Claude Fable 5 est le plafond : quand la tâche est longue, difficile, visuelle ou critique pour l'activité, il est actuellement inégalé, et son modèle de confiance géré est ce que les entreprises achètent réellement. Faites tourner le cheval de trait, louez le spécialiste, et revérifiez les prix et les benchmarks dans les sources officielles ci-dessous, cet appariement change plus vite que tout autre en IA.
À lire ensuite
Sources
- Anthropic - Annonce de Claude Fable 5 et Claude Mythos 5
- Claude Platform Docs - Aperçu des modèles et tarifs
- DeepSeek API Docs - Sortie de DeepSeek V4
- Hugging Face - deepseek-ai/DeepSeek-V4-Pro (poids MIT)
- DataCamp - DeepSeek V4 : fonctionnalités, benchmarks, comparaisons
- Morph - DeepSeek V4 : MoE de 1,6T, contexte 1M, architecture et tarifs
- Anthropic - Redéploiement de Claude Fable 5
- AWS - Claude Fable 5 sur Amazon Bedrock

