Claude Fable 5: API、ベンチマーク、料金、使い方

Built for Speed: ~10ms Latency, Even Under Load
Blazingly fast way to build, track and deploy your models!
- Handles 350+ RPS on just 1 vCPU — no tuning needed
- Production-ready with full enterprise support
Claude Fable 5: API Access, Benchmarks, Pricing & How to Use It
On June 9, 2026, Anthropic did something it had never done before: it handed the public a model from its top-secret "Mythos" tier, the class of models that, until now, only cyber-defense partners and a handful of biology researchers were allowed to touch. The public-safe version is called Claude Fable 5, and it doesn't sit in the Opus family. It sits above it.
If you've spent the last year watching models inch forward half a point at a time on a benchmark, Fable 5 is a jolt. It posts 80.3% on SWE-Bench Pro while the next-best model sits 11 points behind. It finished a migration in a 50-million-line codebase in a day. And Andrej Karpathy called it "a major-version-bump-deserving step change forward." This guide covers what it is, how it benchmarks, what it costs, and exactly how to put it into production, with every figure traced back to Anthropic's launch materials.
What is Claude Fable 5?
Think of Anthropic's lineup as a ladder: Haiku for speed, Sonnet for balance, Opus for hard problems, and now Mythos-class for the genuinely brutal ones. Fable 5 is the first Mythos-class model released for general use. It's designed for ambitious, long-running, asynchronous tasks: large-scale code migrations, multi-day agentic sessions, deep research, and dense knowledge work that previous models simply couldn't hold together.
Anthropic's own framing is the key insight: "the longer and more complex the task, the larger Fable 5's lead over our other models." On a quick one-shot question, you might not notice the difference. Hand it a problem that takes hours and dozens of steps, and the gap becomes obvious.
One wrinkle worth understanding up front: Fable 5 shares its underlying weights with Claude Mythos 5, a restricted release for vetted cybersecurity and biology partners that runs the same model with certain safeguards removed. Fable 5 is the safe-for-everyone twin. (Anthropic notes the name comes from the Latin fabula, "that which is told", a cousin of the Greek mythos. The safeguards are the only thing separating the two.)
Key specifications
Claude Fable 5 benchmarks: the full table
Here's the complete benchmark set Anthropic published at launch. A few things to read carefully:
- The scores shown are the higher of Mythos 5 / Fable 5, they're within 1-3 points of each other on most tests.
- The starred (*) rows are the exception: on cybersecurity, biology, and some reasoning tasks, Fable 5's blocking safeguards kick in, so real-world Fable 5 performance on those rows lands closer to Opus 4.8 (more on that below). Don't quote the starred numbers as "Fable 5" without that caveat.

What actually stands out
- Coding is the headline. +11 points over Opus 4.8 on SWE-Bench Pro, and more than 2x on FrontierCode (Diamond), a benchmark for difficult tasks held to production-codebase standards, where Fable 5 leads even at medium effort. That last part matters: it means strong results without burning maximum reasoning tokens.
- Spatial reasoning nearly tripled over Opus 4.8 (38.6% vs 14.5%).
- Legal reasoning went from "barely passing" to category-leading (13.3% vs GPT-5.5's 2.1% and Gemini's 0.0%).
- The Stripe story puts numbers in context: in a 50-million-line Ruby codebase, Fable 5 ran a codebase-wide migration in a single day, work Stripe estimated at over two months for a full team.
- Vision went SOTA. As a flex, Fable 5 beat Pokémon FireRed using only raw game screenshots, no maps, no navigation aids, no helper harness that earlier models needed.
Andrej Karpathy's launch-day reaction captured the mood, and notably backed up the "step change" framing with a qualitative read, not just the scores:

"The benchmarks are great and it's SOTA on everything by a margin but I'll add that qualitatively also, this is a major-version-bump-deserving step change forward (imo of the same order as Claude 4.5 was in November), peaking especially for long problem-solving sessions on very difficult problems. You can give it a lot more ambitious tasks than what you're used to, the model 'gets it' and it will just go..."
He also flagged the catch that early users are running into: the launch-day safeguards are "configured to be a little too trigger happy," something Anthropic itself acknowledges and says it will tune over time. Which brings us to the part of Fable 5 every API builder needs to understand.
The safeguard fallback (read this before you build)
Because Mythos-class capabilities carry real misuse risk, Fable 5 ships with classifiers covering cybersecurity, biology/chemistry, and distillation. When a request trips one, it's automatically answered by Claude Opus 4.8 instead, and the user is told. Anthropic reports this happens in fewer than 5% of sessions; over 95% of Fable sessions involve no fallback at all.
This is also exactly why the starred benchmark rows above matter: on those cyber/bio tasks, the published high score is Mythos 5's, while Fable 5, with safeguards active, performs closer to Opus 4.8.
What you need to know as a developer:
- If your workload touches security research, bio/chem, or anything the classifiers read as distillation, expect a slice of responses to come from Opus 4.8.
- API customers must configure Anthropic's new Fallback API, on the API it isn't fully automatic the way it is in the Claude apps.
- You aren't charged Fable prices for rerouted requests.
- There's a 30-day data-retention requirement on all Mythos-class traffic, used only for safety monitoring (not training).
A gateway helps here: you can log which requests fell back, route them consistently, and keep the behavior uniform across your app.
Claude Fable 5 pricing
Fable 5 is a premium model, roughly 2x the price of Claude Opus 4.8. Full token economics:
The nuances that decide your real bill:
- Prompt caching gives a 90% discount on cached input, design for it if you reuse large system prompts or context.
- Token efficiency offsets some of the price. Anthropic and early customers report Fable 5 finishing tasks in fewer turns and tokens, so a job at 2x the per-token rate can land closer than the sticker price suggests, on the right tasks.
- US-only inference is available at 1.1x pricing for data-residency needs.
- On Claude.ai subscription plans, Fable 5 counts as 2x usage. It's free on Pro, Max, Team, and seat-based Enterprise from June 9-22, 2026; after June 23 it needs usage credits until capacity allows it to return as a standard feature.
Because Fable 5 is both expensive per token and token-hungry on long tasks, cost control isn't optional. Routing it through a gateway lets you cap spend, cache aggressively, and reserve Fable 5 for the jobs that actually justify it.
How to access the Claude Fable 5 API
Fable 5 is available today on:
- Claude API (Claude Platform), model string claude-fable-5
- Amazon Bedrock、 Google Cloud Vertex AI、 Microsoft Foundry
- TrueFoundry AI Gateway
オプションA、Claude APIを直接呼び出す
ClaudeコンソールからAPIキーを取得し、以下の文字列でモデルを呼び出します claude-fable-5。Anthropicのクイックスタートでは、認証と最初のリクエストの手順が説明されています。詳細は Claude APIドキュメントをご覧ください。
APIを直接呼び出す方法は、簡単なテストや単一のアプリケーションには最適です。しかし、Fable 5が複数のチームで本番環境に導入されると、アクセス制御、予算管理、フォールバックが必要になります。そこでゲートウェイの出番です。
オプションB、TrueFoundry AI Gateway経由でFable 5を呼び出す(本番環境向け推奨)
APIへの直接アクセスはプロトタイプ作成には十分です。しかし、Fable 5のようなプレミアムでトークン消費の多いモデルを組織全体で運用するのは別の問題です。誰が利用できるかを制御し、費用を制限し、セーフガードのフォールバックを一貫して処理し、プロバイダー全体のコストを一元的に把握する必要があります。ゲートウェイはアプリケーションとモデルの間に位置し、これらすべてを処理します。
企業が実際にどのように利用しているか、そしてゲートウェイが優れている理由
- 高価なモデルにおけるコストガバナンス。 100万トークンあたり10ドル/50ドルという価格では、管理されていないFable 5の展開は、あっという間に高額な請求につながる可能性があります。チームはチームごと、アプリケーションごとに予算、レート制限、仮想キーを設定し、最初の請求書が届く前、つまり後ではなく、費用が上限に達し、帰属が明確になるようにします。
- Fable 5と安価なモデル間のスマートルーティング。 ほとんどの企業は、すべてのトラフィックをFable 5に送るわけではありません。難易度の高い、長期的なジョブはFable 5にルーティングし、日常的なトラフィックはOpus 4.8やより小さなモデルにデフォルトで送ります。これにより、重要な部分で最先端の品質を得ながら、すべての場所で最先端の価格を支払う必要がなくなります。
- 自動フォールバックと高可用性 Fable 5のリリース週の需要は高く、予測が困難であると予想されます。チームは、エラー、レート制限、または容量の問題が発生した場合に、Opus 4.8または別のプロバイダーへの自動フォールバックを設定することで、アプリが停止しないようにします。
- すべてのプロバイダーで統合は1つ Fable 5は、Anthropic、Amazon Bedrock、Google Vertex AI、Microsoft Foundryで利用可能です。ゲートウェイを介して、それは1つのOpenAI互換エンドポイントとなるため、プロバイダーやモデルの切り替えは、書き換えやロックインなしで、1行の変更で済みます。
- 可観測性とガバナンスを組み込み すべての呼び出しは、トークン使用量、レイテンシー、リクエストごと、チームごと、モデルごとのコストとともにログに記録され、さらにガードレールと監査証跡も記録されます。これは、新しいモデルが本番環境での使用を承認される前に、セキュリティチームとプラットフォームチームが要求するものです。
実際には、プラットフォームチームはFable 5を数分で全社的に有効にできます。費用管理とフォールバックはすでに設定されており、各チームが生のAPIを接続し、費用が妥当な範囲に収まることを願う必要はありません。
ステップ1:Claude Fable 5をゲートウェイに追加する
TrueFoundryゲートウェイで、接続済みの Anthropic プロバイダーを検索し、 claude-fable-5 を モデル選択 画面で有効にし(その$10 / $50の料金はインラインで表示されます)、そして アクセス制御 を使用して、どのチームと仮想キーがそれを呼び出せるかを決定します。

ステップ2:自動生成されたスニペットで呼び出す
を開きます。 プレイグラウンド、選択し、 claude-fable-5、既製の 利用コードスニペット。TrueFoundryは、OpenAI、LangChain、Node.js、cURL、LlamaIndexなど向けに、ストリーミングモードと非ストリーミングモードの両方でこれを生成します。

メリットは、Fable 5、Opus 4.8、GPT-5.5、またはその他のモデル間の切り替えが1行の変更で済み、すべての呼び出しが管理され、ログに記録され、監視可能であることです。 X-TFY-LOGGING-CONFIG と X-TFY-METADATA ヘッダーを追加して、チームごとまたは機能ごとの費用をタグ付けし、追跡します。
コスト管理とフォールバック機能を初日から備えたFable 5を本番環境に導入する準備はできていますか? TrueFoundry AI GatewayでClaude Fable 5をお試しください。
Claude Fable 5はいつ使用すべきですか?
Fable 5は、大規模な移行、多段階エージェントワークフロー、詳細な調査、複雑な文書分析など、Karpathy氏の言う「もっと野心的なタスクを与える」ことが実際に報われるような、本当に困難で時間がかかるタスクに利用してください。より短く、レイテンシーに敏感な、または大量の作業には、Opus 4.8(半額)またはより小さなモデルを使用する方が、通常は賢明な選択です。ほとんどのチームが落ち着くパターンは次のとおりです。 タスクの複雑さでルーティングする、困難で価値の高いジョブはFable 5へ、それ以外のすべてはより安価なモデルへ、すべて1つのゲートウェイから行います。
よくある質問
Claude Fable 5のAPIモデル名は何ですか? claude-fable-5は、Claude APIおよび主要なクラウドマーケットプレイスを通じて利用可能です。
Claude Fable 5の料金はいくらですか? 入力トークン100万あたり10ドル、出力トークン100万あたり50ドルです。入力には90%のプロンプトキャッシュ割引が適用され、Claude Opus 4.8の約2倍の料金となります。
コンテキストウィンドウはどのくらいですか? 100万トークンで、テキスト、画像、ファイル入力に対応しています。
Claude Fable 5はGPT-5.5より優れていますか? SWE-Bench Proでは、Fable 5 (80.3%) はGPT-5.5 (58.6%) を上回り、Anthropicが公開したほぼすべてのベンチマークで優位に立っています。導入を決定する前に、ご自身のワークロードで検証してください。
Fable 5とMythos 5の違いは何ですか? 基盤となるモデルは同じです。Fable 5は一般利用向けに安全性が確保されたリリースであり、Mythos 5は特定のセーフガードを解除し、厳選されたパートナーに限定されています。
私のリクエストがOpus 4.8の応答を返したのはなぜですか? Fable 5のセーフガードが、サイバーセキュリティ、生物学、化学、蒸留に関するクエリをOpus 4.8にルーティングしました(セッションの5%未満)。これらのクエリに対してFableの料金は請求されません。
TrueFoundry AI Gateway delivers ~3–4 ms latency, handles 350+ RPS on 1 vCPU, scales horizontally with ease, and is production-ready, while LiteLLM suffers from high latency, struggles beyond moderate RPS, lacks built-in scaling, and is best for light or prototype workloads.
The fastest way to build, govern and scale your AI
















.webp)




.png)








.webp)
.webp)








