OpenRouterの2026年料金:プラン、費用、隠れた手数料の完全な内訳
.webp)
Built for Speed: ~10ms Latency, Even Under Load
Blazingly fast way to build, track and deploy your models!
- Handles 350+ RPS on just 1 vCPU — no tuning needed
- Production-ready with full enterprise support
OpenRouterは、単一のOpenAI互換APIを通じて何百ものAIモデルにアクセスできる統合APIゲートウェイをチームに提供します。その利点はシンプルです。1つのOpenRouter APIキー、1つのクレジット残高、1つのベースURLで、多数のプロバイダーアカウントを管理することなく、より迅速なモデル切り替えが可能です。
多くのチームにとって、その利便性は大きな価値があります。OpenRouterは、OpenAI、Anthropic、Google、Gemini、Claude、その他のモデルプロバイダー間で個別のAPIキーをやりくりする手間を軽減します。また、開発者には、さまざまなワークロードにおいてエンドポイント、ルーティング、モデルの動作を比較するための単一のインターフェースを提供します。
チームが規模を拡大する前に、料金体系を詳しく確認する必要があります。無料プランはプロトタイプ作成に適しており、従量課金制は低〜中程度の利用に適しています。後で問題となるのは、5.5%のクレジット購入手数料、BYOKの仕組み、公開SLAの欠如、そして本番環境でのガバナンスの限界です。
このガイドでは、OpenRouterの料金体系、各ティアの費用、そして見出しのトークンレートには表示されない手数料について説明します。また、エージェントワークフロー、コンプライアンス、プライベートデプロイメント、予算ガバナンスが実際の生産ニーズとなった場合に、チームがOpenRouterでは対応しきれなくなるケースについても解説します。
OpenRouterの料金プラン:各ティアに含まれるもの
OpenRouterの料金体系には、無料、従量課金制、エンタープライズの大きく3つのプランがあります。無料ティアは無料モデルのテストに役立ちます。従量課金制は、購入したクレジットを通じて有料モデルへのアクセスを提供します。エンタープライズは、SSO、SLA、サポートを必要とするチーム向けに、交渉済みの制御機能を追加します。
無料ティア
無料ティアでは、25以上の無料モデル、1分あたり20リクエストの制限、および制限された1日あたりのクォータが提供されます。無料ユーザーは1日あたり50件の無料モデルリクエストを行うことができます。アカウントが10ドル以上のクレジットを購入すると、1日あたりの無料モデルリクエスト制限は1,000件に増加します。
無料ティアは、クレジットを購入する前にルーティングロジック、モデルの動作、およびシンプルなプロトタイプのテストに役立ちます。一貫性、スループット、予測可能なレート制限が重要となる本番環境のエージェントワークロード向けには構築されていません。失敗したリクエストでも、利用可能な割り当てが減少する可能性があります。
従量課金制ティア
これはOpenRouterの料金体系における主要な有料オプションです。チームはクレジットカード、仮想通貨、またはその他の対応する支払い方法を使用してクレジットを事前に購入します。OpenRouterはクレジット購入に対して5.5%の手数料を請求しますが、プロバイダーのトークンレートは別途トークンマークアップなしでそのまま適用されます。
例えば、100ドルのクレジットを購入した場合、プラットフォーム手数料を差し引くと、推論に約94.50ドルが残ります。モデルの料金自体は、選択されたモデル、トークン量、完了の長さ、出力トークンによって異なります。応答が長くなるほど、コンテキストが大きくなるほど、ツール出力が大きくなるほど、OpenRouterの総コストは増加します。
チームはモデルページの料金変更にも注意する必要があります。プロバイダーが料金を変更した場合でも、リクエストは引き続き同じモデルにルーティングされます。その後、アカウントには新しい料金が請求され、OpenRouterの課金システムを通じて、それに応じてクレジットが差し引かれます。
エンタープライズティア
エンタープライズティアはカスタム価格設定で、SSO/SAML、契約上のSLA、優先サポート、専用サポートチャネルを追加します。これらの機能は、開発者アクセスや従量課金制アクセスが提供するものよりも強力な制御をチームが必要とする場合に重要です。正確なSLA条件は、エンタープライズ営業プロセス中に交渉されます。
エンタープライズは、チームが本番ワークロード向けに異なるプラン、異なる制限、およびサポートワークフローを必要とする場合にも重要です。購入者は、OpenRouterが大規模アプリケーションにおけるモデルの停止、ピーク時のレイテンシー、プロバイダーのフォールバック、専用の制限、およびサポートのエスカレーションをどのように処理するかを尋ねるべきです。
.webp)
OpenRouterの料金体系における隠れたコスト
表面上のトークン料金は分かりやすいものです。しかし、チームが規模を拡大する前、特にモデルへのアクセスが実験段階から本番アプリケーションに移行する際には、いくつかの他のコストに注意を払う必要があります。これらのコストは、モデルページに表示されているトークンあたりの料金とは別に発生することが多いです。
規模が大きくなると5.5%のプラットフォーム手数料が累積する
この5.5%の手数料は、チームがクレジットを購入するたびに適用されます。少量の利用であれば、OpenRouterが統合時間を節約してくれるため、この手数料は許容範囲に感じられるかもしれません。しかし、大量の利用になると、この割合はプロバイダーの推論コストに加えて、定期的に発生する費用項目となります。
例えば、毎月20万ドルの推論クレジットを購入するチームを考えてみましょう。これは、最初のモデル呼び出しが実行される前に、月額約11,000ドルのプラットフォーム手数料が発生することを意味します。3年間で、継続的な支出と購入パターンによっては、その額は40万ドル近くになる可能性があります。
だからといって、OpenRouterが間違った選択肢になるわけではありません。これは、チームがこの手数料を、エンジニアリングの節約、プロバイダー管理の手間、モデル切り替えの価値と比較検討すべきであることを意味します。チームはより広範な ゲートウェイのコストに関する考慮事項 を、本番ワークロード用のルーティングレイヤーを選択する前に確認することもできます。
無料枠を超えた後のBYOK手数料
BYOK(Bring Your Own Key)を利用すると、OpenRouter APIを使用しながらも、チームは自身のプロバイダーアカウントを通じて呼び出しをルーティングできます。これにより、チームはプロバイダーとの直接的な関係を維持し、個別のAPIキーを管理し、プロバイダー側の割引やレート制限を保持することができます。
標準プランでは、毎月最初の100万件のBYOKリクエストは無料です。そのしきい値を超えると、OpenRouterは、そのプラットフォームで同じ呼び出しにかかるはずだった費用の5%を請求します。エンタープライズプランでは、5%の手数料が適用される前の無料リクエストしきい値が月間500万件に引き上げられます。
BYOKはプラットフォーム手数料を削減できますが、大規模な利用では完全に排除することはできません。また、優先キーやフォールバックキーによってリクエストを受け取るエンドポイントが変わる可能性があるため、慎重な設定が必要です。チームは、この動作をエンジニアリングドキュメントと請求レビュープロセス内で文書化する必要があります。
キューイングなしのレート制限による拒否
リクエストが制限を超過した場合、OpenRouterは直ちにHTTP 429エラーメッセージを返すことがあります。クライアントを安全に待機させるための自動キュー、自動アップグレード、または組み込みのバックオフ機能はありません。呼び出し元のアプリケーションが、リトライ、ペース調整、指数関数的バックオフを処理する必要があります。
これは Claude Code、バッチジョブ、コード生成、画像生成、および詳細な研究ワークフローにとって重要です。これらのワークロードは、特に複雑な推論やツールループが拡大する際に、多くの呼び出しを迅速に行う可能性があります。クライアント側の制御がない場合、レートの急増によってワークフローが中断される可能性があります。
チームは、ピーク時、プロバイダーによるスロットリング、および上流の制限変更も考慮に入れる必要があります。OpenRouter自身のプラットフォームはリクエストを効率的にルーティングするかもしれませんが、プロバイダーレベルの制限は依然として実際のスループットに影響を与えます。そのため、アプリケーション側のレート制限はエンジニアリング要件となります。
SLA条件には交渉が必要
エンタープライズの購入者は通常、重要なワークロードを移行する前に明確な稼働時間のコミットメントを必要とします。OpenRouterは、すべての購入者に対して標準的なSLA条件を公開していません。契約上の稼働時間保証は、エンタープライズ交渉と調達レビューを通じて行われる必要があります。
これは実用的な評価上の疑問を生じさせます。チームは、ゲートウェイが故障した場合、プロバイダーが故障した場合、そしてフォールバックパスが品質の低下を引き起こした場合に何が起こるかを知る必要があります。公開されたSLA数値がない場合、調達が承認する前に信頼性要件を明確にする必要があります。
OpenRouterの料金体系が有効な場合とそうでない場合
チームがプライベートデプロイメントや厳格なガバナンスよりもプロバイダーの柔軟性を重視する場合、OpenRouterの料金体系は理にかなっています。これは、専門モデルのパネルをテストし、各メンバーを比較し、アプリケーションコードを変更することなく、各タスクに最適な最新モデルを選択するのに役立ちます。
OpenRouterがその料金に見合う価値を発揮するのは、次のような状況です。
- チームが複数のプロバイダーにわたって3つ以上のモデルを運用している場合。
- 一元化された請求と単一のAPIキーにより、運用上の摩擦が軽減されます。
- OpenAI、Anthropic、Google、Gemini間でベンチマークを評価している場合。
- 推論、コード生成、または画像生成のために、迅速なモデル切り替えが必要な場合。
- ルーティングを通じて、高いパフォーマンス、低遅延、または高精度が必要な場合。
- 利用量が中程度で、プラットフォーム料金が許容範囲内である場合。
次のような状況では、有効でなくなります。
- 大量の利用で、単一の主要モデルに固定されている場合。
- 実際のルーティングのメリットなしに、5.5%の手数料がオーバーヘッドになる場合。
- ユースケースでVPCネイティブなデプロイメントまたはプライベートな推論パスが必要な場合。
- チームがRBAC、監査証跡、チームごとの予算を必要とする場合。
- エージェントワークフローにおけるツール利用に対して、より強力な制御が必要な場合。
- セキュリティチームが、プロンプトがネットワーク境界を離れることを許容できない場合。
率直な見方はシンプルです。OpenRouterは、モデル評価や中程度のマルチモデルワークロードにとって強力な導入手段です。 OpenRouterの代替手段の必要性 は、規制対象のチームが、OpenRouterのダッシュボードでは不十分なガバナンス、プライベートデプロイメント、およびコンプライアンスの証拠を必要とする場合に生じます。
.webp)
エンタープライズチーム向けOpenRouter料金の対象外となるもの
OpenRouterはモデルルーティングレイヤーであり、完全なガバナンスプラットフォームではありません。チームがカスタムのエンタープライズ契約に移行した場合でも、いくつかのエンタープライズ要件は標準のOpenRouter料金の対象外となります。
- チームごとのコスト配分: OpenRouterはキーとアカウントで利用状況を追跡します。個々のチーム、アプリケーション、環境、またはワークロードへの利用状況のマッピングには、通常、カスタムの計測が必要です。1つのキーが共有バケットになることもあります。
- モデルおよびツールレベルでのRBAC: OpenRouterは、企業が本番環境のコントロールプレーンに期待するような、モデルおよびツールレベルのガバナンスを提供しません。キーを持つ人なら誰でも許可されたモデルにアクセスできるため、セキュリティ上の盲点が生じます。
- VPCネイティブデプロイメント: 呼び出しはOpenRouterのインフラストラクチャを経由するため、プロンプトと応答は顧客のネットワーク境界を離れます。規制対象業界では、プロンプトに顧客データや内部データが含まれる場合、これはデータレジデンシーの問題となる可能性があります。
- コンプライアンスのための監査証跡: キーごとのログは、ユーザーに帰属する監査証拠とは異なります。コンプライアンスチームは、多くの場合、ユーザーID、モデル、プロンプトのメタデータ、コスト、ポリシーの結果、および保持制御を必要とします。 SOC 2またはHIPAAのレビュー。
- エージェントワークフローのガバナンス: OpenRouterはモデル呼び出しをルーティングできますが、エージェントワークフローの完全なパスをガバナンスするわけではありません。ツール呼び出し、MCPアクセス、ループ制限、エージェントレベルの予算は、依然として別の強制レイヤーが必要です。
エンタープライズチーム向けOpenRouterの代替としてのTrueFoundry
TrueFoundry は、エンタープライズチームにOpenRouterで好まれるようなモデルアクセス利便性を提供しつつ、リクエストパスに対するより強力なガバナンスを実現します。焦点はルーティングだけではありません。誰がどのモデルを呼び出せるか、どれくらいの費用を使えるか、そしてデータがどこに移動できるかを制御することです。
A ガバナンスされたゲートウェイ は、AIトラフィックが実験段階を超えると重要になります。チームは、推論が実行される前に、予算の強制、RBAC、可観測性、および監査証跡を必要とします。これは、プロンプトに機密データが含まれる場合や、モデル呼び出しが本番ワークフローをサポートする場合に、より重要になります。
TrueFoundryは、チームが以下のような状況にある場合に特に役立ちます。
- プラットフォーム手数料なし: チームはプロバイダーに直接支払い、TrueFoundryを使用してルーティング、予算、アクセスポリシー、可観測性を管理します。利用料に対するプラットフォーム手数料は一切かかりません。
- プライベートデプロイの選択肢: 推論呼び出し、プロンプト、応答は、AWS、GCP、Azure、オンプレミス、またはエアギャップ環境内に留めることができます。
- 厳格な予算管理: チーム、モデル、アプリケーション、環境、またはユーザー全体で、推論コストが発生する前に支出上限を適用できます。
- IDに基づいたアクセス制御: RBACは、どのユーザー、チーム、アプリケーションが承認されたモデルやワークフローにアクセスできるかをチームが制御するのに役立ちます。
- 監査対応ロギング: すべてのモデル呼び出しは、ユーザーID、モデル、コスト、レイテンシー、応答メタデータとともに、顧客環境内でログに記録できます。
- エージェントとツールのガバナンス: The Agent Gateway は、自律型ワークフロー、エージェントの動作、ループ制限、およびダウンストリームツールへのアクセスをチームが管理するのにも役立ちます。これは、モデル呼び出しがより大規模なエージェントワークフローの一部となる場合に重要です。
エージェントのワークロードでは、ガバナンスの必要性がより重要になります。TrueFoundryは、ループ制限、サーキットブレーカー、ランタイムポリシー、ユーザーに帰属する監査証跡を含むエージェントワークフローのガバナンスをサポートします。これにより、暴走セッションが課金やセキュリティインシデントを引き起こす前に防ぐことができます。
TrueFoundryは、単一のアクセスレイヤーの利便性を維持しつつ、本番チームが必要とする制御を追加します。企業は、柔軟なモデルアクセスとより強力な運用ガバナンスのどちらかを選択する必要はありません。
デモを予約する TrueFoundryがモデル、エージェント、ツール、予算、監査を安全に管理する方法をご覧ください。
TrueFoundry AI Gateway delivers ~3–4 ms latency, handles 350+ RPS on 1 vCPU, scales horizontally with ease, and is production-ready, while LiteLLM suffers from high latency, struggles beyond moderate RPS, lacks built-in scaling, and is best for light or prototype workloads.
The fastest way to build, govern and scale your AI


Recent Blogs
Frequently asked questions
What is OpenRouter pricing for pay-as-you-go users in 2026?
OpenRouter pricing for pay-as-you-go users is based on prepaid credits. OpenRouter charges a 5.5% fee on credit purchases, while model token rates are passed through by providers. For example, a $100 purchase gives about $94.50 of inference credits. Crypto payments carry a 5% fee, with a minimum transaction fee.
Does OpenRouter charge more than going directly to Anthropic or OpenAI?
OpenRouter does not add a markup to provider token rates. The difference comes from the 5.5% credit-purchase fee and BYOK fees after the free threshold. For multi-model routing, that fee may be worth it. For one high-volume model, direct provider access may cost less.
What are the OpenRouter free tier limits, and which models does it include?
OpenRouter’s free tier includes 25+ free models and a 20 requests-per-minute limit for free-model variants. Accounts with less than $10 in credits receive 50 free model requests per day. Accounts with at least $10 in credits receive 1,000 free model requests per day. Failed requests may still count.
What is the BYOK structure in OpenRouter pricing, and when does the 5% fee apply?
BYOK allows teams to use their own provider keys via OpenRouter. The first 1 million BYOK requests each month are free on standard plans. After that, OpenRouter charges 5% of what the same call would have cost on its platform. Enterprise raises the free request threshold to 5 million per month.
Does OpenRouter offer an SLA, and what are the published uptime commitments?
OpenRouter does not publish standard uptime commitments for all plans. Contractual SLAs are available through enterprise negotiation, along with SSO/SAML, custom pricing, and priority support. Teams with production reliability requirements should confirm uptime terms, support response times, fallback behavior, and escalation paths before signing.










.webp)




.png)








.webp)
.webp)








