DeepSeek V4, rilasciato il April 24, 2026 sotto licenza MIT, ha reso concreta una promessa familiare: pesi aperti statisticamente alla pari con le recenti punte di diamante chiuse sui benchmark a cui gli sviluppatori tengono. Claude Fable 5, rilasciato il June 9, 2026, ha risposto dalla direzione opposta: un modello di classe Mythos che spinge il tetto più in alto di qualsiasi sistema disponibile in generale prima di esso. In realtà non si contendono gli stessi acquirenti, ma quasi ogni team ora deve decidere come dividere il lavoro tra queste due filosofie.
Verdetto rapido
DeepSeek V4 vince su economia, apertura e volume: coding quasi di frontiera all'uno o due percento dei prezzi di frontiera, pesi che puoi scaricare, mettere a punto e ospitare in proprio. Claude Fable 5 vince sul tetto: le esecuzioni di agenti autonomi più lunghe, il ragionamento più difficile, visione e analisi finanziaria allo stato dell'arte e una storia di fiducia enterprise con meccaniche di sicurezza esplicite. La maggior parte degli stack sofisticati nel 2026 usa un cavallo di battaglia aperto per i molti e un modello di frontiera per i pochi: questo abbinamento è l'archetipo.
Scegli DeepSeek V4 se
- Il costo domina: V4-Pro a $0.435/$0.87 per milione di token (con input in cache-hit a $0.003625) è circa 23x più economico sull'input e 57x più economico sull'output rispetto a Fable 5.
- Vuoi un coding competitivo: 80.6% su SWE-bench Verified (il punteggio più alto tra i pesi aperti, alla pari con Gemini 3.1 Pro), 93.5 su LiveCodeBench, Codeforces ELO 3206, davanti al 3168 di GPT-5.5.
- Ti serve il controllo: pesi con licenza MIT su Hugging Face, self-hosting, messa a punto e piena sovranità sui dati.
- Generi output enormi: V4 supporta fino a 384k token di output, il triplo dei 128k di Fable 5.
Scegli Claude Fable 5 se
- I tuoi compiti stanno alla frontiera: allo stato dell'arte su quasi tutti i benchmark testati da Anthropic, il punteggio FrontierCode più alto tra i modelli di frontiera e il miglior risultato di qualsiasi modello sul benchmark finanziario di Hebbia.
- Gli agenti devono sopravvivere a ore di lavoro autonomo: Fable 5 gira più a lungo di qualsiasi Claude precedente, con guadagni di memoria pari a circa 3x quelli di Opus 4.8.
- Ti serve un'infrastruttura enterprise gestita: SLA su Claude API, AWS Bedrock, Google Cloud e Microsoft Foundry, più rifiuti strutturati con riprove gratuite e credito di fallback.
- La visione conta: Fable 5 è il modello allo stato dell'arte di Anthropic per il lavoro ricco di immagini; i punti di forza di V4 sono concentrati in testo e codice.
In sintesi
| Caratteristica | Claude Fable 5 | DeepSeek V4-Pro | DeepSeek V4-Flash |
|---|---|---|---|
| Licenza | API proprietaria | Pesi aperti, MIT (Hugging Face) | |
| Architettura | Non divulgata | MoE, 1.6T totali / 49B parametri attivi | MoE, 284B totali / 13B attivi |
| Finestra di contesto | 1M token | 1M token (predefinita) | |
| Output massimo | 128k token | 384k token | |
| Prezzo API (per 1M token) | $10 / $50 | $0.435 / $0.87 (input in cache-hit $0.003625) | $0.14 / $0.28 |
| SWE-bench Verified | Livello stato dell'arte (Anthropic riporta SOTA su quasi tutti i benchmark testati) | 80.6%, miglior punteggio tra i pesi aperti | Inferiore, ottimizzato per la velocità |
| Codeforces ELO | Non pubblicato | 3206 (sopra il 3168 di GPT-5.5) | - |
| Self-hosting / messa a punto | No | Sì, pesi completi, uso commerciale consentito | |
| Visione | Stato dell'arte | Focus limitato | |
| Meccaniche di sicurezza | Classificatori + rifiuti strutturati + fallback | Nessuna integrata, allineamento e filtraggio sono a tuo carico | |
L'economia, onestamente
Il moltiplicatore grezzo è sconcertante, da 23x a 57x, ma il confronto onesto include ciò che il prezzo delle API non mostra:
- Lavoro di volume: per classificazione, estrazione, stesura di routine e coding di media complessità su larga scala, V4 (o V4-Flash a $0.14/$0.28) è così economico che la qualità per dollaro è imbattibile. Far passare lo stesso volume attraverso Fable 5 è economicamente indifendibile.
- Verifica di realtà sul self-hosting: pesi gratuiti non significano inferenza gratuita. V4-Pro attiva 49B di parametri per token da una MoE da 1.6T, servirlo bene richiede una seria infrastruttura multi-GPU, tempo di MLOps e pianificazione della capacità. Al di sotto di un alto volume sostenuto, l'API di DeepSeek stessa (o un fornitore in hosting) batte il self-hosting sul costo reale.
- Economia del fallimento: sui compiti al tetto, un modello economico che fallisce due volte e poi ha bisogno di un ingegnere costa più di un modello premium che riesce una volta sola. Il prezzo per token non è il prezzo per risultato.
Benchmark contro il tetto
I numeri di DeepSeek V4 meritano rispetto: l'80.6% su SWE-bench Verified pareggia Gemini 3.1 Pro e si colloca statisticamente al livello di Claude Opus 4.7 (80.8%), una punta di diamante chiusa di appena qualche mese prima. Il suo Codeforces 3206 batte GPT-5.5 di netto nella programmazione competitiva. La lettura franca: l'open source ora eguaglia la generazione di frontiera precedente.
Fable 5 definisce quella attuale. Anthropic riporta risultati allo stato dell'arte su quasi tutti i benchmark testati, il punteggio FrontierCode più alto tra i modelli di frontiera perfino con effort medio, il miglior risultato finanziario di Hebbia di qualsiasi modello e visione SOTA. Dove il divario diventa pratico anziché statistico è la resistenza: la migrazione Ruby da 50 milioni di righe di Stripe, compressa da mesi a giorni, è il tipo di lavoro di lungo orizzonte e alta coerenza in cui nessun modello aperto ancora compete, i punti di forza di V4 sono per singolo compito, quelli di Fable 5 si sommano nell'arco delle ore.
Privacy, sovranità e fiducia, due filosofie
Questa è la differenza più profonda. DeepSeek offre controllo: i pesi MIT significano che i tuoi dati possono restare interamente sul tuo hardware, messi a punto sul tuo dominio, verificabili a livello di peso, decisivo per ambienti air-gapped, regimi rigorosi di residenza dei dati e chiunque sia diffidente all'idea di inviare il codice più prezioso a terze parti (alcune organizzazioni valutano anche la geopolitica di un fornitore con sede in Cina quando usano l'API in hosting, il self-hosting aggira del tutto la questione). Erediti anche tutta la responsabilità: allineamento, resistenza al jailbreak e prevenzione degli abusi sono a tuo carico.
Anthropic offre responsabilità: Fable 5 arriva con classificatori di sicurezza (che scattano in meno del 5% delle sessioni), rifiuti strutturati che non costano nulla, un fallback documentato verso Opus 4.8, una policy di conservazione di 30 giorni senza addestramento sui dati API e uno storico di azione sotto pressione, avendo messo in pausa il modello a pochi giorni dalla scoperta di un aggiramento di exploit e ridistribuendolo il July 1, 2026 con un classificatore che blocca quell'aggiramento in oltre il 99% dei casi più un bounty pubblico HackerOne. Nessuna delle due filosofie è più sicura in senso stretto; ripongono la fiducia in mani diverse.
Per i principianti
Se stai scegliendo un assistente chat anziché un'API, la risposta pratica: le app di DeepSeek vanno da gratuite a molto economiche e sono sorprendentemente capaci per domande, scrittura e aiuto allo studio; i piani a pagamento di Claude ti comprano il ragionamento più forte disponibile ovunque più una gestione documentale curata. Parti gratis su entrambi. Se ti ritrovi a incollare documenti lunghi, a destreggiarti in progetti multi-step o a fidarti delle risposte per decisioni di lavoro, quello è il momento in cui l'upgrade a Claude si ripaga.
Per gli ingegneri: il pattern del router
Lo stack di consenso del 2026 tratta questi due come strati, non rivali: indirizza i compiti ad alto volume e ben specificati verso V4 (in hosting o self-hosted), fai salire gli agenti di lungo orizzonte e i compiti al tetto verso Fable 5 e registra abbastanza da accorgerti quando una classe di compiti inizia a fallire sul livello economico. Nota le asimmetrie di integrazione: Fable 5 richiede la gestione dei rifiuti (stop_reason "refusal") e il pensiero adattivo sempre attivo con ragionamento solo riassunto; V4 richiede di portare le tue protezioni e, se in self-hosting, una piattaforma di inferenza per una MoE da 1.6T parametri. Metti a budget il tempo di ingegneria per qualunque onere tu scelga, ce n'è uno in ogni caso.
Errori comuni
- Confrontare i prezzi per token invece dei prezzi per risultato: un modello 57x più economico che non riesce a finire il compito è infinitamente più costoso.
- Presumere che il self-hosting sia gratuito: GPU, operazioni e rischio di utilizzo spesso superano le fatture delle API al di sotto di una scala seria.
- Inviare per policy il lavoro solo di frontiera al livello economico: rivedi l'instradamento ogni mese, entrambe le famiglie si muovono in fretta.
- Ignorare i limiti di output nell'altra direzione: i 384k token di output di V4 battono i 128k di Fable 5 per generazioni massicce in un colpo solo, a volte il modello aperto è l'unico che sta nel compito.
- Saltare le protezioni sui modelli aperti: V4 arriva senza classificatori di sicurezza; l'uso in produzione richiede il tuo strato di filtraggio.
Raccomandazione finale
DeepSeek V4 è il miglior modello a pesi aperti della metà del 2026 e l'ovvia impostazione economica predefinita per il grosso dei carichi di lavoro IA, specialmente con la licenza MIT che rende assoluto il controllo. Claude Fable 5 è il tetto: quando il compito è lungo, difficile, visivo o critico per il business, è attualmente impareggiabile, e il suo modello di fiducia gestito è ciò che le imprese comprano davvero. Fai girare il cavallo di battaglia, noleggia lo specialista e riverifica prezzi e benchmark nelle fonti ufficiali qui sotto, questo abbinamento cambia più in fretta di qualsiasi altro nell'IA.
Da leggere dopo
Fonti
- Anthropic - Annuncio di Claude Fable 5 e Claude Mythos 5
- Claude Platform Docs - Panoramica dei modelli e prezzi
- DeepSeek API Docs - Rilascio di DeepSeek V4
- Hugging Face - deepseek-ai/DeepSeek-V4-Pro (pesi MIT)
- DataCamp - DeepSeek V4: funzionalità, benchmark, confronti
- Morph - DeepSeek V4: MoE da 1.6T, contesto da 1M, architettura e prezzi
- Anthropic - Ridistribuzione di Claude Fable 5
- AWS - Claude Fable 5 su Amazon Bedrock

