Esta es la rivalidad más interesante de la IA ahora mismo: Anthropic lanza un modelo extraordinario, Google lanza un ecosistema. Claude Fable 5 (lanzado el 9 de junio de 2026) se sitúa por encima de la clase Opus de Anthropic y es puntero en casi todos los benchmarks que Anthropic probó. Gemini responde no con un modelo, sino con un portafolio con precios que van de lo económico a lo premium, conectado a Search, Workspace, Android y Google Cloud. Ambos caminos llevan a la capacidad de frontera; la diferencia está en cómo la compras y dónde se ejecuta.
Veredicto rápido
Claude Fable 5 es la elección cuando necesitas el modelo de disponibilidad general más capaz que existe: las ejecuciones de agentes autónomos más largas, resistencia de programación de frontera y razonamiento cuidadoso sobre entradas enormes a precio plano. Gemini es la elección cuando la relación precio-rendimiento, la multimodalidad en toda la pila de Google o la mayor ventana de contexto del sector, 2M de tokens (Gemini 3 Ultra), importan más que exprimir los últimos puntos de capacidad.
Elige Claude Fable 5 si
- Tus agentes deben ejecutarse durante horas sin perder coherencia: Fable 5 trabaja de forma autónoma más tiempo que cualquier Claude anterior, con mejoras de memoria que valen aproximadamente 3x las de Opus 4.8 en evaluaciones de largo recorrido.
- Quieres las mejores puntuaciones donde duele: la más alta entre los modelos de frontera en el FrontierCode de Cognition (incluso con effort medio) y la puntuación más alta de cualquier modelo en el benchmark de finanzas de Hebbia.
- Necesitas un comportamiento de ingeniería predecible: precio plano de $10/$50 en toda la ventana de 1M, rechazos legibles por máquina, peticiones rechazadas gratuitas y respaldo integrado.
Elige Gemini si
- Optimizas el coste por unidad de inteligencia: Gemini 3.1 Pro a $2/$12 por millón de tokens es aproximadamente una quinta parte del precio de Fable 5 y encabezó 13 de 16 benchmarks seguidos en su lanzamiento.
- Necesitas más de 1M de tokens de contexto: Gemini 3 Ultra ofrece una ventana de 2M de tokens, la mayor de cualquier modelo comercial de frontera, a $10/$30.
- Tu organización vive en Google Workspace, o quieres planes de consumo (Google AI Pro a $19.99/mes, AI Ultra desde $99.99/mes) integrados en Gmail, Docs y Android.
- Quieres un nivel de agentes barato y veloz: Gemini 3.5 Flash ($1.50/$9) obtiene 76,2% en Terminal-bench 2.1 y 55,1% en SWE-Bench Pro, algo notable para su rango de precio.
De un vistazo
| Característica | Claude Fable 5 | Gemini 3.1 Pro | Gemini 3 Ultra |
|---|---|---|---|
| Rol | Buque insignia único de clase Mythos | Buque insignia de valor | Premium, mayor contexto |
| Ventana de contexto | 1M de tokens | 1M de tokens | 2M de tokens |
| Salida máxima | 128k tokens | Depende del modelo | Depende del modelo |
| Precio de API (por 1M de tokens) | $10 / $50 | $2 / $12 (prompts hasta 200k) | $10 / $30 |
| Fortaleza distintiva | Resistencia de agentes, programación de frontera, razonamiento cuidadoso | Precio-rendimiento, récord de 94,3% en GPQA Diamond | La mayor ventana de contexto comercial |
| Razonamiento | Pensamiento adaptativo siempre activo + control de effort | Pensamiento configurable | Nivel de razonamiento profundo |
| Ecosistema | Claude API, AWS Bedrock, Google Cloud, Microsoft Foundry, Claude Code | Google AI Studio, Vertex AI, Workspace, Android, Search | |
| Retención de datos (API) | 30 días, no se usa para entrenamiento | Configurable mediante controles de Google Cloud | |
Precios: una tarifa plana frente a una escalera
La propuesta de Anthropic es la simplicidad: $10 de entrada, $50 de salida, el millón de tokens completo, sin niveles. La propuesta de Google es la elección: Flash a $1.50/$9 para volumen, 3.1 Pro a $2/$12 para la mayoría del trabajo, Ultra a $10/$30 cuando necesitas la ventana de 2M. Tres observaciones prácticas:
- Para el tráfico cotidiano de API, Gemini 3.1 Pro es drásticamente más barato: unas 5x en entrada y 4x en salida frente a Fable 5. Si tus tareas no necesitan profundidad de clase Mythos, esa diferencia se acumula rápido.
- Para trabajo con mucha salida (informes largos, generación de código), fíjate en que la tarifa de salida de $30 de Ultra queda por debajo de los $50 de Fable 5 mientras ofrece el doble de contexto.
- Para el 10% más difícil (agentes de varias horas, refactorizaciones espinosas, análisis de alto riesgo), el sobreprecio por token de Fable 5 suele amortizarse en menos reintentos y menos limpieza humana. Una ejecución fallida de $2 cuesta más que una exitosa de $10.
Benchmarks y resultados reales
Sobre el papel, los dos se intercambian golpes. Gemini 3.1 Pro ostenta la puntuación GPQA Diamond más alta jamás registrada (94,3%) y lideró 13 de 16 benchmarks seguidos en su lanzamiento. Fable 5 es puntero en casi todos los benchmarks que Anthropic probó, encabeza el FrontierCode de Cognition entre los modelos de frontera incluso con effort medio y ostenta la puntuación más alta de cualquier modelo en el benchmark de finanzas de Hebbia. Anthropic también lo reporta como puntero en tareas de visión.
Las señales del mundo real pueden importar más que las tablas de clasificación. Stripe usó Fable 5 para comprimir una migración de Ruby de 50 millones de líneas de meses a días. Del lado de Gemini, el 76,2% de 3.5 Flash en Terminal-bench 2.1 muestra a Google llevando la capacidad agéntica a su nivel más barato, una filosofía distinta: Anthropic concentra la capacidad máxima en un solo modelo, Google difunde una capacidad sólida por toda una familia.
Ventanas de contexto: 1M vs 2M
La ventana de 1M de tokens de Fable 5 (unas 555k palabras) cubre casi cualquier carga de trabajo práctica: bases de código enteras, cientos de documentos, semanas de transcripciones. Un matiz que los aficionados deberían conocer: Fable 5 usa el tokenizador introducido con Opus 4.7, que produce alrededor de un 30% más de tokens para el mismo texto que los modelos Claude anteriores a 4.7; presupuesta en consecuencia. La ventana de 2M de Gemini 3 Ultra es la salida de emergencia cuando ni siquiera eso basta: salas de datos completas, conjuntos masivos de litigios, varios repositorios a la vez. Si tu trabajo supera de verdad el millón de tokens por petición, Gemini Ultra es ahora mismo la única respuesta comercial; se espera que el retrasado Gemini 3.5 Pro lleve los 2M a la gama media cuando se lance.
Para principiantes
Como asistente diario, ambos son excelentes y el factor decisivo es el hábitat. Si tu vida gira en torno a Gmail, Docs, Drive y Android, los planes de consumo de Gemini ponen un asistente potente directamente dentro de esas herramientas por $19.99/mes. Si quieres el razonamiento más fuerte disponible en una interfaz de chat limpia (para escribir, estudiar, analizar y recibir ayuda de programación), Claude con acceso a Fable 5 es el motor más potente. Prueba los niveles gratuitos de ambos con las mismas tres tareas de tu semana real; quédate con aquel cuyas respuestas editaste menos.
Para desarrolladores y usuarios avanzados
Los detalles de integración difieren más de lo que sugiere el marketing. Fable 5 mantiene el pensamiento adaptativo siempre activo (ajustas la profundidad mediante el parámetro effort, y la cadena de pensamiento en bruto nunca se devuelve), admite la memory tool, ejecución de código, llamada programática a herramientas y compactación, y devuelve los rechazos como valores estructurados de stop_reason con reintentos gratuitos aguas abajo. La pila Vertex AI de Gemini ofrece control granular de endpoints (global, multirregión, regional), integraciones estrechas con BigQuery y Workspace, y la comodidad de un único proveedor desde el almacén de datos hasta el modelo. Los equipos que ya están en Google Cloud pueden incluso partir la diferencia: los modelos Claude, incluido Fable 5, están disponibles a través de Google Cloud junto a Gemini, de modo que el patrón de enrutador solo necesita una factura de nube.
Seguridad y gobernanza
Fable 5 llega con clasificadores de seguridad que rechazan ciertas peticiones (menos del 5% de las sesiones de media, sobre todo temas de ciberseguridad y biología), recurriendo a respuestas de Opus 4.8, con una política de retención de 30 días y sin entrenamiento sobre el tráfico de la API. Su pausa por controles de exportación de junio de 2026 y su redespliegue del 1 de julio (con un nuevo clasificador que bloquea el jailbreak reportado en más del 99% de los casos, más un programa de recompensas de HackerOne) hicieron su postura de seguridad inusualmente transparente. Google se apoya en la gobernanza empresarial de Vertex AI: políticas de organización, residencia de datos mediante endpoints regionales y controles de administración de nivel Workspace. Los sectores regulados encontrarán respuestas útiles en ambos, expresadas en idiomas distintos: Anthropic habla de garantías a nivel de modelo, Google habla de controles a nivel de nube.
Errores comunes
- Comprar el contexto más grande por defecto: la mayoría de las configuraciones con recuperación aumentada superan a los prompts de fuerza bruta de 2M de tokens a una fracción del coste. Recurre a Ultra cuando de verdad lo necesites.
- Ignorar el cambio de tokenizador: Fable 5 cuenta ~30% más tokens que los modelos Claude antiguos para el mismo texto; actualiza tus presupuestos al migrar.
- Tratar una tabla de clasificación como la verdad: GPQA mide preguntas científicas, FrontierCode mide ingeniería; elige benchmarks con la forma de tu trabajo.
- Subestimar los modelos de clase Flash: para tareas simples de alto volumen, Gemini 3.5 Flash a $1.50/$9 a menudo gana a usar cualquier buque insignia.
- Dependencia de proveedor por inercia: ambos están en Google Cloud; pruébalos en paralelo antes de estandarizar.
Recomendación final
Elige Claude Fable 5 como tu modelo cumbre: es la IA de disponibilidad general más fuerte de mediados de 2026, con una resistencia de agentes y un comportamiento de ingeniería que ningún nivel de Gemini iguala del todo. Elige Gemini como tu flota: 3.1 Pro para un excelente tráfico predeterminado y barato, Flash para volumen, Ultra cuando 2M de tokens sea el requisito. Los equipos más fuertes que vemos ejecutan exactamente esa división: la economía de Gemini para lo masivo, la potencia de Fable 5 para las pocas tareas que deciden el trimestre.
Sigue leyendo
Fuentes
- Anthropic - Anuncio de Claude Fable 5 y Claude Mythos 5
- Claude Platform Docs - Visión general de modelos y precios
- Google AI for Developers - Modelos de la API de Gemini
- TokenCost - Precios de la API de Gemini 3: Ultra, Pro y Flash comparados (2026)
- eesel AI - Precios de Google Gemini 3 en 2026: planes, modelos y costes de API
- Anthropic - Redespliegue de Claude Fable 5
- AWS - Claude Fable 5 en Amazon Bedrock
- Tech Insider - Gemini 3.5 Pro se retrasa a julio de 2026

