創造性、AIシステム、そしてTruefoundry:ニクンジ・バジャージと共に

Built for Speed: ~10ms Latency, Even Under Load
Blazingly fast way to build, track and deploy your models!
- Handles 350+ RPS on just 1 vCPU — no tuning needed
- Production-ready with full enterprise support
機会からではなく、深く経験したことから事業を築く、ある種の起業家がいます。TrueFoundryの共同創設者兼CEOであるNikunj Bajaj氏も、そのような起業家の一人です。最近のArden Labsポッドキャストでの対談で、彼はカルカッタでの幼少期から、インドで最も競争の激しい入学試験の一つを突破したこと、そしてパンデミックによるロックダウン中、2人の共同創設者と共に一部屋でマットレスの上で過ごし、最終的にTrueFoundryとなる会社のアイデアを練ったことまで、自身の道のりの全貌を語りました。
その全貌を聞くには忍耐が必要な物語です。
カルカッタからIITへ、IITからバークレーへ
Nikunj氏はカルカッタで、堅実で質素な家庭に育ちました。彼自身が語るように、それは何年もの間、同じ家、同じ友人、同じ近所で過ごす、安定していて一貫した幼少期でした。彼自身の言葉によれば、幼い頃からIITを夢見ていた人物ではありませんでした。その考えは、その道を歩んだ人々との会話や、工学と数学への関心が高まるにつれて、徐々に彼の中に芽生えました。
その後、インドのIITの入学試験に向けた2年間の猛勉強が始まりました。 毎年50万人の学生がこの試験を受けます。合格するのは数千人です。Nikunj氏もその一人でした。
IITの中で最も古く、最大のIITカラグプルで、彼はロボット工学と、動き、世界に反応するものを構築するという可能性に惹かれ、計測工学を選びました。教室の外で、彼はまさにそれを実行しました。彼のチームは自律走行型地上車両を開発し、米国で開催されたロボット競技会にインド代表として出場した最初のチームとなりました。それが彼にとって初めてのアメリカへの旅でした。
その後、イスラエルとインド双方のアドバイザーからの研究推薦を通じて、UCバークレーでのインターンシップが決まりました。そのインターンシップが全てを変えました。彼の研究は非常にうまくいき、指導教官から修士課程のために戻ってくるよう誘われました。そこで彼は妻とも出会いました。彼女は同じプログラムに参加しており、彼の研究室の仲間でした。彼は、一つのインターンシップが自身のキャリアと人生の両方を整理したと振り返ります。
Meta時代と全てを始めた洞察
2014年にバークレーで修士号を取得した後、Nikunj氏は、eコマース業界にサービスを提供するAI企業Reflektionに、初期の機械学習エンジニアの一人として入社しました。3年半以上にわたり、彼はMLチームを率いるまでに昇進し、社内機械学習開発者プラットフォームを構築しました。これは、彼が後にキャリアを捧げて解決することになるインフラ問題の最初の具体的な兆候でした。
そしてMetaへ。
Metaでは、同社がトランスフォーマーベースのモデルに深く注力していた時期に、Nikunj氏は会話型AIチームで働いていました。これは後にChatGPTや生成AIの波を牽引することになる技術と同じものです。しかし、技術的な経験だけでなく、Metaの社内MLプラットフォームの運用上の現実が彼の中に深く残りました。
「Metaの個人開発者として、私は誰にも頼ることなく、機械学習モデルを構築し、1万ノードで起動することができました」と彼はポッドキャストで語りました。Metaの外では、そのような機能はパブリッククラウドのエコシステムには存在しませんでした。企業は、ソフトウェア用、ML用、そしてますます生成AI用と、断片化された並行するスタック上で機械学習アプリケーションを構築していました。その非効率性は、別の方法を知っている人にとっては明らかでした。
その観察がTrueFoundryの創業仮説となりました。それは、機械学習がいずれ変曲点に達し、その時点で企業はMetaが社内で構築したような、統一された垂直統合型インフラプラットフォームを緊急に必要とするだろうというものでした。問題はそれが起こるかどうかではなく、いつ起こるかでした。
パンデミック、ピボット、そして新たな始まり
TrueFoundryの前には、Enthireがありました。2020年初頭、Nikunj氏と彼の2人の共同創設者(Metaにも在籍していたAbhishek氏と、WorldQuantで機械学習を用いてトレーディング戦略を構築していたAnurag氏)は、別の問題、すなわち技術系採用面接の非効率性を解決するために仕事を辞めました。
Nikunj氏が言うように、そのタイミングは最悪でした(あるいは、より明確になったとも言えます!)。彼らは2020年3月にバンガロールに到着しましたが、その数日後にはインド全土がロックダウンに入りました。他に行く場所がなかったため、3人全員が友人の2LDKのアパートの一室で数ヶ月間、マットレスを敷いて寝泊まりし、ゼロから会社を立ち上げることになりました。
Enthireは成長しました。1年以内に40〜50社の顧客を獲得し、Y Combinatorにも採択されました。しかし、YCに参加する前に4年間で3500万ドル以上を費やして驚くほど似たような会社を立ち上げていたYCパートナーとの決定的な会話が、彼らに聞くべき正直な評価を与えました。それは、そのビジネスモデルには突破できない天井があるというものでした。それは運用負荷が高すぎ、ニッチすぎ、そして深い技術的背景を持つ3人の創業者にはあまり適していませんでした。
彼らは事業からの撤退を決め、その事業は大手インド企業に買収された後、彼らは振り出しに戻った。次に生まれたのがTrueFoundryで、これはニクンジとアビシェクがMeta時代から持ち続けていたインフラに関する知見に基づいて構築されたものだった。
企業が求めていたプラットフォームの構築
TrueFoundryは2021年末に設立された。これはChatGPTが生成AIを一般的な話題にする1年以上前のことだ。この先行者利益は非常に大きかった。なぜなら、このプラットフォームはMetaのアーキテクチャを指針として最初から設計されており、生成AIを機械学習の特殊なケースとして、そして機械学習をソフトウェアの特殊なケースとして扱っていたからだ。市場がまさにそれを突然要求したとき、すでに大規模言語モデルのワークロードをサポートする能力を備えていたのである。
「ChatGPTがリリースされたとき、私たちは根本的なアーキテクチャ変更を行う必要はありませんでした」とニクンジは語った。「私たちは機械学習を念頭に置いており、それはデフォルトでLLMをサポートするはずでした。」
彼らの最初の主要なエンタープライズ顧客は、世界最大級の製薬会社の一つだった。それ以来、TrueFoundryはベイエリア、ボストン、バンガロール、ロンドンにまたがる100人近いチームに成長した。製品は、企業が独自のインフラ上でカスタムモデルやエージェントを実行できるようにする当初のAIデプロイメントプラットフォームから拡張され、企業がモデル、エージェント、MCPサーバーに対して行うすべてのAPIコールの中心に位置する統合コントロールプレーンであるAIゲートウェイを含むようになった。
このゲートウェイは、ガバナンス、コンプライアンス、コスト管理を強制する。AIスタック全体にわたる完全な可観測性を提供し、世界17の地域で稼働しており、99.99%以上の稼働時間を達成し、5ミリ秒未満のレイテンシーで、本番環境の重要なアプリケーション向けに毎秒数万のリクエストを処理している。
若い頃の自分に伝えたいこと
この道のりを始めたばかりの自分にどんなアドバイスをするかと尋ねられると、ニクンジの答えは彼らしい地に足の着いたものだった。
地味な仕事でも、並外れてうまくやり遂げること。
「かっこいい問題に取り組んでいるときは、楽しいものです。しかし、少し地味な仕事になると、すべてを疑問に思い始めることがあります」と彼は語った。「私のアドバイスは、何をするにしても、たとえ面白くない仕事であっても、その仕事自体を誇りに思えるほど完璧にやり遂げることです。」
そのアプローチの複利効果は過小評価されている、と彼は主張する。人々は、平凡なタスクであっても世界レベルの実行力に気づくものだ。そうした人たちが、後であなたと一緒に仕事をしたいと思うようになる。あなたの個人的な成長とあなたのエコシステムは共に成長するのだ。
それは、カルカッタでの2年間の静かな準備から、6桁の給与よりも修士号を選ぶこと、Enthireの後、ゼロから再構築すること、そしてTrueFoundryが最初の本番ワークロードを提供する前に1年間インフラに集中することまで、彼の物語のあらゆる章を貫く哲学であると言える。
長期的な視点で一貫して取り組むことは、報われる傾向がある。
ニクンジ・バジャージとの全対談は、Arden Labsポッドキャストで、SpotifyとApple Podcastsにて今すぐお聴きいただけます。
TrueFoundry AI Gateway delivers ~3–4 ms latency, handles 350+ RPS on 1 vCPU, scales horizontally with ease, and is production-ready, while LiteLLM suffers from high latency, struggles beyond moderate RPS, lacks built-in scaling, and is best for light or prototype workloads.
The fastest way to build, govern and scale your AI












.webp)




.png)








.webp)
.webp)








