Questa è la rivalità più interessante nell'IA di questo momento: Anthropic distribuisce un modello straordinario, Google distribuisce un ecosistema. Claude Fable 5 (rilasciato il June 9, 2026) si colloca sopra la classe Opus di Anthropic ed è allo stato dell'arte su quasi ogni benchmark testato da Anthropic. Gemini risponde non con un modello ma con un portfolio dal prezzo economico a quello premium, integrato in Search, Workspace, Android e Google Cloud. Entrambe le strade portano alla capacità di frontiera, la differenza è come la compri e dove viene eseguita.
Verdetto rapido
Claude Fable 5 è la scelta quando ti serve il singolo modello più capace disponibile in generale: le esecuzioni di agenti autonomi più lunghe, la resistenza di coding di frontiera e un ragionamento attento su input enormi a prezzo piatto. Gemini è la scelta quando il rapporto prezzo-prestazioni, la multimodalità su tutto lo stack Google o la più grande finestra di contesto del settore da 2M token (Gemini 3 Ultra) contano più che spremere gli ultimi punti di capacità.
Scegli Claude Fable 5 se
- I tuoi agenti devono lavorare per ore senza perdere coerenza: Fable 5 lavora in autonomia più a lungo di qualsiasi Claude precedente, con guadagni di memoria pari a circa 3x Opus 4.8 nelle valutazioni di lungo orizzonte.
- Vuoi i punteggi migliori dove conta: il più alto tra i modelli di frontiera su FrontierCode di Cognition (perfino con effort medio) e il punteggio più alto di qualsiasi modello sul benchmark finanziario Hebbia.
- Ti serve un comportamento di ingegneria prevedibile: prezzo piatto $10/$50 su tutto il contesto da 1M, rifiuti leggibili dalle macchine, richieste rifiutate gratuite e fallback nativo.
Scegli Gemini se
- Ottimizzi il costo per unità di intelligenza: Gemini 3.1 Pro a $2/$12 per milione di token è circa un quinto del prezzo di Fable 5 e ha superato 13 dei 16 benchmark monitorati al suo lancio.
- Ti servono più di 1M token di contesto: Gemini 3 Ultra offre una finestra da 2M token, la più grande di qualsiasi modello di frontiera commerciale, a $10/$30.
- La tua organizzazione vive dentro Google Workspace, oppure vuoi i piani consumer (Google AI Pro a $19.99/month, AI Ultra da $99.99/month) collegati a Gmail, Docs e Android.
- Vuoi un livello di agenti economico e veloce: Gemini 3.5 Flash ($1.50/$9) ottiene il 76.2% su Terminal-bench 2.1 e il 55.1% su SWE-Bench Pro, notevole per la sua fascia di prezzo.
In sintesi
| Caratteristica | Claude Fable 5 | Gemini 3.1 Pro | Gemini 3 Ultra |
|---|---|---|---|
| Ruolo | Singola punta di diamante di classe Mythos | Punta di diamante di valore | Premium, contesto più grande |
| Finestra di contesto | 1M token | 1M token | 2M token |
| Output massimo | 128k token | Dipende dal modello | Dipende dal modello |
| Prezzo API (per 1M token) | $10 / $50 | $2 / $12 (prompt fino a 200k) | $10 / $30 |
| Punto di forza distintivo | Resistenza degli agenti, coding di frontiera, ragionamento attento | Prezzo-prestazioni, record 94.3% GPQA Diamond | La più grande finestra di contesto commerciale |
| Ragionamento | Pensiero adattivo sempre attivo + controllo effort | Pensiero configurabile | Livello di ragionamento profondo |
| Ecosistema | Claude API, AWS Bedrock, Google Cloud, Microsoft Foundry, Claude Code | Google AI Studio, Vertex AI, Workspace, Android, Search | |
| Conservazione dei dati (API) | 30 giorni, non usati per l'addestramento | Configurabile tramite i controlli di Google Cloud | |
Prezzi: una tariffa piatta contro una scala
La proposta di Anthropic è la semplicità: $10 in ingresso, $50 in uscita, il milione di token intero, senza livelli. La proposta di Google è la scelta: Flash a $1.50/$9 per i volumi, 3.1 Pro a $2/$12 per la maggior parte del lavoro, Ultra a $10/$30 quando ti serve la finestra da 2M. Tre osservazioni pratiche:
- Per il traffico API quotidiano, Gemini 3.1 Pro è nettamente più economico, circa 5x sull'input e 4x sull'output rispetto a Fable 5. Se i tuoi compiti non richiedono la profondità di classe Mythos, quella differenza si accumula in fretta.
- Per il lavoro a forte output (lunghi report, generazione di codice), nota che la tariffa di output di Ultra da $30 batte i $50 di Fable 5 offrendo il doppio del contesto.
- Per il 10% più difficile, agenti di più ore, refactoring complessi, analisi ad alta posta in gioco, il sovrapprezzo per token di Fable 5 spesso si ripaga con meno tentativi ripetuti e meno pulizia manuale. Un'esecuzione fallita da $2 costa più di una riuscita da $10.
Benchmark e risultati reali
Sulla carta i due si scambiano colpi. Gemini 3.1 Pro detiene il punteggio GPQA Diamond più alto mai registrato (94.3%) e ha guidato 13 dei 16 benchmark monitorati al lancio. Fable 5 è allo stato dell'arte su quasi tutti i benchmark testati da Anthropic, guida FrontierCode di Cognition tra i modelli di frontiera perfino con effort medio e detiene il punteggio più alto di qualsiasi modello sul benchmark finanziario di Hebbia. Anthropic lo riporta anche come stato dell'arte per i compiti di visione.
I segnali del mondo reale possono contare più delle classifiche. Stripe ha usato Fable 5 per comprimere una migrazione Ruby da 50 milioni di righe da mesi a giorni. Dal lato Gemini, il 76.2% di 3.5 Flash su Terminal-bench 2.1 mostra Google che spinge la capacità agentica nel suo livello più economico, una filosofia diversa: Anthropic concentra la capacità di punta in un solo modello, Google diffonde una forte capacità in una famiglia.
Finestre di contesto: 1M vs 2M
La finestra da 1M token di Fable 5 (all'incirca 555k parole) copre quasi ogni carico di lavoro pratico: interi codebase, centinaia di documenti, settimane di trascrizioni. Una sfumatura che gli appassionati dovrebbero conoscere: Fable 5 usa il tokenizzatore introdotto con Opus 4.7, che produce circa il 30% di token in più per lo stesso testo rispetto ai modelli Claude precedenti al 4.7, quindi calcola il budget di conseguenza. La finestra da 2M di Gemini 3 Ultra è la via di fuga quando persino quella non basta: data room complete, enormi fascicoli di contenzioso, diversi repository in una volta. Se il tuo lavoro supera davvero il milione di token per richiesta, Gemini Ultra è attualmente l'unica risposta commerciale; l'atteso Gemini 3.5 Pro dovrebbe portare i 2M nella fascia media quando uscirà.
Per i principianti
Come assistente quotidiano, entrambi sono eccellenti e il fattore decisivo è l'habitat. Se la tua vita gira su Gmail, Docs, Drive e Android, i piani consumer di Gemini mettono un assistente potente proprio dentro quegli strumenti per $19.99/month. Se vuoi il ragionamento più forte disponibile in un'interfaccia di chat pulita, per scrivere, studiare, analizzare e ricevere aiuto con il codice, Claude con l'accesso a Fable 5 è il motore più potente. Prova i piani gratuiti di entrambi sugli stessi tre compiti della tua settimana reale; tieni quello le cui risposte hai modificato meno.
Per sviluppatori ed esperti
I dettagli di integrazione differiscono più di quanto suggerisca il marketing. Fable 5 mantiene il pensiero adattivo sempre attivo (ne regoli la profondità tramite il parametro effort e la catena di pensiero grezza non viene mai restituita), supporta memory tool, esecuzione di codice, chiamata di strumenti programmatica e compattazione, e restituisce i rifiuti come valori strutturati di stop_reason con riprove gratuite a valle. Lo stack Vertex AI di Gemini offre un controllo granulare degli endpoint (globale, multiregione, regionale), agganci stretti a BigQuery e Workspace e la comodità di un unico fornitore dal data warehouse al modello. I team già su Google Cloud possono anche fare la via di mezzo: i modelli Claude, incluso Fable 5, sono disponibili tramite Google Cloud accanto a Gemini, così il pattern del router richiede una sola fattura cloud.
Sicurezza e governance
Fable 5 arriva con classificatori di sicurezza che rifiutano certe richieste (in media meno del 5% delle sessioni, per lo più temi di cybersicurezza e biologia), ripiegando sulle risposte di Opus 4.8, con una policy di conservazione di 30 giorni e nessun addestramento sul traffico API. La sua pausa per i controlli sulle esportazioni di June 2026 e la ridistribuzione del July 1, con un nuovo classificatore che blocca il jailbreak segnalato in oltre il 99% dei casi più un programma di bounty HackerOne, hanno reso la sua postura di sicurezza insolitamente trasparente. Google si appoggia alla governance enterprise di Vertex AI: policy organizzative, residenza dei dati tramite endpoint regionali e controlli amministrativi di livello Workspace. I settori regolamentati troveranno risposte utilizzabili su entrambi, espresse in lingue diverse: Anthropic parla di garanzie a livello di modello, Google parla di controlli a livello di cloud.
Errori comuni
- Comprare il contesto più grande per impostazione predefinita: la maggior parte delle configurazioni con recupero aumentato batte i prompt a forza bruta da 2M token a una frazione del costo. Ricorri a Ultra quando ti serve davvero.
- Ignorare il cambio di tokenizzatore: Fable 5 conta circa il 30% di token in più rispetto ai modelli Claude più vecchi per lo stesso testo, aggiorna i tuoi budget quando migri.
- Trattare una sola classifica come verità: GPQA misura le domande e risposte scientifiche, FrontierCode misura l'ingegneria, scegli benchmark con la forma del tuo lavoro.
- Sottovalutare i modelli di classe Flash: per compiti semplici ad alto volume, Gemini 3.5 Flash a $1.50/$9 spesso batte l'uso di qualsiasi punta di diamante.
- Vincolo al fornitore per inerzia: entrambi sono su Google Cloud, provali fianco a fianco prima di standardizzare.
Raccomandazione finale
Scegli Claude Fable 5 come tuo modello di vertice: è l'IA disponibile in generale più forte della metà del 2026, con una resistenza degli agenti e un comportamento di ingegneria che nessun livello Gemini eguaglia del tutto. Scegli Gemini come tua flotta: 3.1 Pro per un ottimo traffico predefinito ed economico, Flash per i volumi, Ultra quando i 2M token sono il requisito. I team più forti che vediamo eseguono esattamente questa divisione: l'economia di Gemini per i molti, la potenza di fuoco di Fable 5 per i pochi compiti che decidono il trimestre.
Da leggere dopo
Fonti
- Anthropic - Annuncio di Claude Fable 5 e Claude Mythos 5
- Claude Platform Docs - Panoramica dei modelli e prezzi
- Google AI for Developers - Modelli dell'API Gemini
- TokenCost - Prezzi API di Gemini 3: Ultra, Pro, Flash a confronto (2026)
- eesel AI - Prezzi di Google Gemini 3 nel 2026: piani, modelli e costi API
- Anthropic - Ridistribuzione di Claude Fable 5
- AWS - Claude Fable 5 su Amazon Bedrock
- Tech Insider - Gemini 3.5 Pro slitta a July 2026

