Це найцікавіше суперництво в ШІ прямо зараз: Anthropic випускає одну надзвичайну модель, Google випускає екосистему. Claude Fable 5 (випущений 9 червня 2026 року) стоїть вище класу Opus від Anthropic і є найкращим у галузі майже на кожному бенчмарку, який тестувала Anthropic. Gemini відповідає не однією моделлю, а портфелем із цінами від бюджетних до преміальних, вбудованим у Search, Workspace, Android і Google Cloud. Обидві дороги ведуть до передових можливостей - різниця в тому, як ви їх купуєте і де вони працюють.
Короткий вердикт
Claude Fable 5 - це вибір, коли вам потрібна найпотужніша загальнодоступна модель: найдовші автономні запуски агентів, передова витривалість у кодуванні та ретельні міркування над величезними вхідними даними за фіксованою ціною. Gemini - це вибір, коли співвідношення ціни та якості, мультимодальність у всьому стеку Google або найбільше в галузі контекстне вікно на 2M токенів (Gemini 3 Ultra) важать більше, ніж вичавлювання останніх кількох балів можливостей.
Оберіть Claude Fable 5, якщо
- Ваші агенти мають працювати годинами без втрати послідовності - Fable 5 працює автономно довше за будь-яку попередню модель Claude, з приростом пам'яті приблизно у 3x порівняно з Opus 4.8 в оцінках із довгим горизонтом.
- Вам потрібні найвищі бали там, де це болить: найвищий серед передових моделей на FrontierCode від Cognition (навіть за середнього рівня effort) і найвищий бал серед усіх моделей на фінансовому бенчмарку Hebbia.
- Вам потрібна передбачувана інженерна поведінка: фіксовані ціни $10/$50 на всьому контексті у 1M, машиночитані відмови, безкоштовні відхилені запити і вбудований перехід.
Оберіть Gemini, якщо
- Ви оптимізуєте вартість на одиницю інтелекту: Gemini 3.1 Pro за $2/$12 за мільйон токенів - це приблизно п'ята частина ціни Fable 5, і на своєму запуску він очолив 13 з 16 відстежуваних бенчмарків.
- Вам потрібно більше ніж 1M токенів контексту: Gemini 3 Ultra пропонує вікно на 2M токенів - найбільше серед усіх комерційних передових моделей - за $10/$30.
- Ваша організація живе у Google Workspace, або вам потрібні споживчі тарифи (Google AI Pro за $19.99/місяць, AI Ultra від $99.99/місяць), вбудовані в Gmail, Docs і Android.
- Вам потрібен дешевий швидкий рівень агентів: Gemini 3.5 Flash ($1.50/$9) набирає 76.2% на Terminal-bench 2.1 і 55.1% на SWE-Bench Pro - неймовірно для свого цінового класу.
Стисло про головне
| Характеристика | Claude Fable 5 | Gemini 3.1 Pro | Gemini 3 Ultra |
|---|---|---|---|
| Роль | Єдиний флагман класу Mythos | Флагман за співвідношенням ціни/якості | Преміум, найбільший контекст |
| Контекстне вікно | 1M токенів | 1M токенів | 2M токенів |
| Макс. вихід | 128k токенів | Залежить від моделі | Залежить від моделі |
| Ціна API (за 1M токенів) | $10 / $50 | $2 / $12 (запити до 200k) | $10 / $30 |
| Фірмова сила | Витривалість агентів, передове кодування, ретельні міркування | Ціна/якість, рекорд 94.3% GPQA Diamond | Найбільше комерційне контекстне вікно |
| Міркування | Адаптивне мислення завжди увімкнене + контроль effort | Налаштовуване мислення | Рівень глибоких міркувань |
| Екосистема | Claude API, AWS Bedrock, Google Cloud, Microsoft Foundry, Claude Code | Google AI Studio, Vertex AI, Workspace, Android, Search | |
| Зберігання даних (API) | 30 днів, не використовується для навчання | Налаштовується через контролі Google Cloud | |
Ціни: одна фіксована ставка проти драбини
Пропозиція Anthropic - це простота: $10 за вхід, $50 за вихід, повний мільйон токенів, жодних рівнів. Пропозиція Google - це вибір: Flash за $1.50/$9 для обсягів, 3.1 Pro за $2/$12 для більшості роботи, Ultra за $10/$30, коли вам потрібне вікно на 2M. Три практичні спостереження:
- Для щоденного трафіку API Gemini 3.1 Pro значно дешевший - приблизно 5x за вхід і 4x за вихід порівняно з Fable 5. Якщо ваші завдання не потребують глибини класу Mythos, ця різниця швидко накопичується.
- Для роботи з великим виходом (довгі звіти, генерація коду) зауважте, що вихідна ставка Ultra $30 нижча за $50 у Fable 5, при цьому пропонує вдвічі більший контекст.
- Для найскладніших 10% - багатогодинні агенти, заплутані рефакторинги, аналіз з високими ставками - надбавка Fable 5 за токен часто окупається меншою кількістю повторів і меншим людським доопрацюванням. Невдалий запуск за $2 коштує більше, ніж успішний за $10.
Бенчмарки і результати з реального світу
На папері ці дві моделі обмінюються ударами. Gemini 3.1 Pro тримає найвищий бал GPQA Diamond, коли-небудь зафіксований (94.3%), і на запуску очолив 13 з 16 відстежуваних бенчмарків. Fable 5 є найкращим у галузі майже на всіх бенчмарках, які тестувала Anthropic, очолює FrontierCode від Cognition серед передових моделей навіть за середнього рівня effort і тримає найвищий бал серед усіх моделей на фінансовому бенчмарку Hebbia. Anthropic також повідомляє про нього як про найкращий у галузі для завдань із зором.
Сигнали з реального світу можуть важити більше, ніж таблиці лідерів. Stripe застосувала Fable 5, щоб стиснути міграцію 50 мільйонів рядків Ruby з місяців у дні. З боку Gemini, 76.2% у 3.5 Flash на Terminal-bench 2.1 показують, як Google проштовхує агентні можливості у свій найдешевший рівень - інша філософія: Anthropic концентрує пікові можливості в одній моделі, Google розсіює сильні можливості по всій родині.
Контекстні вікна: 1M vs 2M
Вікно Fable 5 на 1M токенів (приблизно 555k слів) покриває майже кожне практичне навантаження: цілі кодові репозиторії, сотні документів, тижні транскриптів. Один нюанс, який варто знати гікам: Fable 5 використовує токенізатор, представлений з Opus 4.7, який видає приблизно на 30% більше токенів для того самого тексту, ніж моделі Claude до 4.7 - плануйте бюджет відповідно. Вікно Gemini 3 Ultra на 2M - це запасний вихід, коли навіть цього недостатньо: повні кімнати даних, масивні судові справи, кілька репозиторіїв одночасно. Якщо ваша робота справді перевищує мільйон токенів на запит, Gemini Ultra наразі єдина комерційна відповідь; відкладений Gemini 3.5 Pro, як очікується, принесе 2M у середній рівень, коли вийде.
Для новачків
Як щоденний асистент обидва чудові, а вирішальний чинник - середовище. Якщо ваше життя тримається на Gmail, Docs, Drive і Android, споживчі тарифи Gemini поміщають сильного асистента прямо всередину цих інструментів за $19.99/місяць. Якщо ви хочете найсильніші доступні міркування в чистому інтерфейсі чату - для письма, навчання, аналізу і допомоги з кодом - Claude з доступом до Fable 5 є потужнішим двигуном. Спробуйте обидва безкоштовні рівні на тих самих трьох завданнях зі свого реального тижня; залиште той, чиї відповіді ви редагували менше.
Для розробників і профі
Деталі інтеграції відрізняються більше, ніж підказує маркетинг. Fable 5 тримає адаптивне мислення завжди увімкненим (ви налаштовуєте глибину через параметр effort, а сирий ланцюжок міркувань ніколи не повертається), підтримує memory tool, виконання коду, програмний виклик інструментів і компакцію, і повертає відмови як структуровані значення stop_reason з безкоштовними повторами нижче за потоком. Стек Vertex AI від Google пропонує детальний контроль ендпойнтів (глобальний, мультирегіональний, регіональний), тісні гачки BigQuery і Workspace та зручність одного постачальника від сховища даних до моделі. Команди, що вже на Google Cloud, можуть навіть розділити різницю: моделі Claude, включно з Fable 5, доступні через Google Cloud поряд із Gemini - тож патерн маршрутизатора потребує лише одного рахунку за хмару.
Безпека і врядування
Fable 5 постачається з класифікаторами безпеки, що відхиляють певні запити (у середньому менш ніж у 5% сесій, здебільшого теми кібербезпеки та біології), з переходом на відповіді Opus 4.8, з політикою зберігання 30 днів і без навчання на трафіку API. Його пауза через експортний контроль у червні 2026 року і повторне розгортання 1 липня - з новим класифікатором, що блокує повідомлений джейлбрейк у понад 99% випадків, плюс програма винагород HackerOne - зробили його безпековий стан незвично прозорим. Google спирається на корпоративне врядування Vertex AI: організаційні політики, резидентність даних через регіональні ендпойнти і адмінконтролі рівня Workspace. Регульовані галузі знайдуть придатні відповіді в обох, висловлені різними мовами: Anthropic говорить про гарантії на рівні моделі, Google говорить про контролі на рівні хмари.
Поширені помилки
- Купівля найбільшого контексту за замовчуванням: більшість налаштувань із доповненим пошуком (RAG) перевершують грубі запити на 2M токенів за частку вартості. Тягніться до Ultra, коли він вам справді потрібен.
- Ігнорування зміни токенізатора: Fable 5 рахує ~30% більше токенів, ніж старіші моделі Claude для того самого тексту - оновіть бюджети під час міграції.
- Ставлення до однієї таблиці лідерів як до істини: GPQA вимірює наукові Q&A, FrontierCode вимірює інженерію - обирайте бенчмарки за формою вашої роботи.
- Недооцінка моделей класу Flash: для високооб'ємних простих завдань Gemini 3.5 Flash за $1.50/$9 часто краще, ніж узагалі використовувати будь-який флагман.
- Прив'язка до постачальника за інерцією: обидва на Google Cloud - протестуйте їх пліч-о-пліч перед стандартизацією.
Фінальна рекомендація
Оберіть Claude Fable 5 як свою вершинну модель: це найсильніший загальнодоступний ШІ середини 2026 року, з витривалістю агентів та інженерною поведінкою, яку жоден рівень Gemini повністю не повторює. Оберіть Gemini як свій флот: 3.1 Pro для чудового-і-дешевого трафіку за замовчуванням, Flash для обсягів, Ultra, коли вимога - 2M токенів. Найсильніші команди, які ми бачимо, роблять саме такий розподіл - економіка Gemini для багатьох, вогнева міць Fable 5 для тих кількох завдань, що вирішують квартал.
Читайте далі
Джерела
- Anthropic - анонс Claude Fable 5 та Claude Mythos 5
- Claude Platform Docs - огляд моделей та ціни
- Google AI for Developers - моделі Gemini API
- TokenCost - ціни Gemini 3 API: Ultra, Pro, Flash у порівнянні (2026)
- eesel AI - ціни Google Gemini 3 2026: тарифи, моделі та витрати API
- Anthropic - повторне розгортання Claude Fable 5
- AWS - Claude Fable 5 на Amazon Bedrock
- Tech Insider - Gemini 3.5 Pro переноситься на липень 2026

