TrueFoundry

Built for Speed: ~10ms Latency, Even Under Load

Blazingly fast way to build, track and deploy your models!

Handles 350+ RPS on just 1 vCPU — no tuning needed
Production-ready with full enterprise support

Get Started with Truefoundry Now Talk to the Expert

企業はAIを本番環境に導入しています。エージェントは稼働し、ワークフローは実行され、デモは成功しています。しかし、この勢いの裏で、セキュリティ上の問題が静かに発生しつつあります。誰がどのモデルにアクセスしているのか？これらのシステムをどのようなデータが流れているのか？効果的なガードレールは導入されているのか？ほとんどの組織にとって、正直な答えは「完全ではない」でしょう。

このギャップこそが、Palo Alto NetworksがPortkeyを買収しようとする意図を論理的な動きにしています。Portkeyは、企業アプリケーションとOpenAI、Anthropic、MistralなどのLLMプロバイダーの間に位置し、ルーティング、フェイルオーバー、キャッシング、コスト追跡、可観測性を処理します。Palo Altoのもとでは、その機能はセキュリティとガバナンスの視点、アクセス制御、ガードレール、そしてどのモデルに誰がアクセスしているかという可視性を通してフィルタリングされるでしょう。サイバーセキュリティ企業にとって、これは自然で戦略的な事業拡大です。しかし、それが企業のAIインフラがどこへ向かっているかを示す兆候こそが、より重要な話です。機械学習と人工知能

誰も警告しなかったインフラのギャップ

過去2年間で、企業はAIの導入を急速に進めてきました。コパイロット、AIエージェント、LLMを活用したワークフローは、今や企業の本番環境に不可欠なものとなっています。しかし、アプリケーション層での急速な進歩は、堅牢なサポートインフラの構築を犠牲にしてきました。

その結果は？チームは、エージェントの動作に対する可視性が限られた状態でAIを本番運用しています。TrueFoundryの2026年企業AI調査データによると、75%以上のチームが、モデルとエージェントのワークフロー全体で完全に統合されたロギングを欠いていることが明らかになりました。40%以上が、AIコストを使用後にしか把握できず、リアルタイムのアラートや予算管理がありません。そして83%がトークン増幅を報告しており、これは1,000トークンを消費すると予想されるタスクが、エージェントの呼び出しチェーンを通じて8,000トークン以上を消費してしまう現象です。レイテンシーの急増は診断が難しく、障害の根本原因を追跡するには、元の問題をさらに悪化させるようなエンジニアリングの労力が必要となることがよくあります。

AIゲートウェイが実際にすること

AIゲートウェイは、企業アプリケーションと、それらを動かす大規模言語モデルの間の制御層です。アプリケーションがOpenAIやAnthropicのようなプロバイダーを直接呼び出すのではなく、リクエストはゲートウェイを経由し、ルーティング、可観測性、信頼性、コスト管理を一元的に行います。

プロバイダーが遅延したり障害が発生したりした場合、ゲートウェイはトラフィックをリダイレクトします。コストが急増した場合、チームはリアルタイムで原因を特定できます。予期せぬプロンプトの動作は、調査のための完全なトレースログを明らかにします。新しいモデルをテストするのに、アプリケーションを再デプロイする必要はありません。ソフトウェア

複数のAI機能を管理するチームにとって、このインフラはすぐに不可欠なものとなります。それがなければ、ポリシーの一元的な推論ポイントがなく、AIスタックが何をしているかという統一されたビューもなく、コストを帰属させたりインシデントを調査したりする明確な方法もありません。

AIゲートウェイはセキュリティをはるかに超える

セキュリティとガバナンスは、ゲートウェイが提供する重要な側面の一つであり、Palo Altoの動きが戦略的に理にかなっている正当な理由でもあります。しかし、企業はコスト管理、パフォーマンス監視、プロバイダーの柔軟性、データガバナンス、そしてプライベートおよびオープンソースのオプションのサポートを含むモデルルーティングも必要としています。主にセキュリティに限定されたゲートウェイでは、ITチームやエンジニアリングチームが複数のツールを寄せ集めてギャップを埋めざるを得なくなります。

詳細を見る
データ管理
クラウドストレージ
ソフトウェア
サイバーセキュリティ
機械学習と人工知能

より広範な業界がこれを認識しています。Gartnerの2025年AIゲートウェイ市場ガイドによると、2028年までに、マルチモーダルアプリケーションを構築するソフトウェアエンジニアリングチームの70%が、セキュリティだけでなく、信頼性の向上とコスト最適化のためにAIゲートウェイを使用するようになるでしょう。GartnerはAIゲートウェイを「アプリケーションと様々なAIサービスまたはモデルの間の仲介役として機能する」テクノロジーと定義しており、AIワークロードを保護、管理、監視するための中央制御パネルを提供します。その範囲は意図的に広範です。

これを正しく理解している組織は、AIゲートウェイをセキュリティのアドオンや後付けではなく、基盤となるインフラとして扱います。彼らは、APIゲートウェイやサービスメッシュと同様に、最初からスタックに統合し、その上にツールの範囲を拡張していきます。その逆ではありません。

構築または購入前の重要な質問

AI Gatewayの選択肢を検討している、あるいはそもそも必要かどうかを判断しているエンタープライズチームにとって、問いかけるべき質問は以下の通りです。

本番環境で実行されているすべてのLLM呼び出しについて、コストやレイテンシーを含め、可視化できていますか？
プロバイダーがダウンしたり、費用が高くなりすぎたりした場合に、トラフィックを再ルーティングできますか？
商用APIとセルフホスト型モデルの両方を使用できる柔軟性がありますか？
機密データはどこを流れ、誰がそれを管理していますか？

これらの質問のいずれかに対して正直な答えが「そうではない」というのであれば、対処すべきインフラのギャップが存在します。AIが実験的なプロジェクトから中核的な製品機能へと移行するにつれて、このギャップを放置しておくことのコストは増大するばかりです。

Palo AltoによるPortkey買収の動きは、極めて重要な瞬間を示しています。AI Gatewayが不可欠なエンタープライズインフラとして認識されつつあるのです。今後の課題は、企業がAI Gatewayをどの程度広範囲に活用していくかです。

TrueFoundryについて：

TrueFoundryは、LLM Gateway、MCP Gateway、Agent Gatewayを網羅するエンタープライズグレードのAI Gatewayを提供し、企業が単一のコントロールプレーンからモデル、ツール、ガードレール、エージェントへのアクセスを安全に接続、監視、管理できるようにします。このAI Gatewayは、プロバイダーを横断する統合された構成可能な接続を通じて、安全で効率的、かつ将来にわたって利用可能なエージェントワークロードを実現します。

ゲートウェイ層を超えて、TrueFoundryは、Kubernetesネイティブなインターフェースを通じて、組織がGPU上でカスタムLLMをデプロイおよびトレーニングし、MCPサーバーをホストし、カスタムエージェントを実行することを可能にします。AI Gatewayとデプロイメント環境の両方で、オンプレミスおよびVPCへのインストールをサポートしています。TrueFoundryは、SOC 2、HIPAA、ITARの各標準に準拠したエンタープライズグレードのコンプライアンスを保証します。組み込みのオートスケーリング、キャッシング、リソース最適化により、TrueFoundryは、組織がAIシステムを安全かつ効率的に、将来にわたって利用可能なスタック上で構築、デプロイ、管理することを可能にします。詳細については、以下をご覧ください。 truefoundry.com

TrueFoundry AI Gateway delivers ~3–4 ms latency, handles 350+ RPS on 1 vCPU, scales horizontally with ease, and is production-ready, while LiteLLM suffers from high latency, struggles beyond moderate RPS, lacks built-in scaling, and is best for light or prototype workloads.

Built for Speed: ~10ms Latency, Even Under Load

Schedule your Demo Now