Blank white background with no objects or features visible.

TrueFoundryはSeldon AIの買収を発表し、エンタープライズAI向けコントロールプレーンを拡張します。プレスリリース全文はこちら→

TrueFoundryが今、オープンソースLLMのデプロイとファインチューニングを数クリックで実現!

By TrueFoundry

Published: July 4, 2026

TrueFoundryが、大規模言語モデル(LLM)のデプロイとファインチューニングのための、強力かつ使いやすいソリューションを開発したことをご紹介できることを大変嬉しく思います。 モデルカタログ。私たちは、企業がKubernetes上でオープンソースLLMをセルフホストできるよう支援し、ワンクリックで推論コストを10分の1にすることを目指しています。このブログでは、 Dolly-v2-3b モデルをデプロイし、 Pythia-70M モデルをTrueFoundryでファインチューニングする方法をご紹介します。

LLMはMLOpsに対する私たちの考え方を変えるのか?

TrueFoundryプラットフォーム は、ロジスティック回帰のような最もシンプルなものから、Stable Diffusionのような最先端のモデルまで、あらゆる種類の機械学習および深層学習モデルをサポートするように設計されています。大規模言語モデルに関しては、なぜ新しいものを構築する必要があるのか、と疑問に思うかもしれません。

これらのモデルの途方もないサイズと複雑さは、実世界のアプリケーションにデプロイする際に大きな課題となります。TrueFoundryプラットフォームはすでにあらゆるサイズのモデルを大規模にデプロイすることをサポートしていましたが、これらのモデルに対してさらに最適化(コストと時間)とユーザーエクスペリエンスの改善ができることに気づきました。

大規模言語モデル(LLM)は定着します。

ChatGPTのような大規模言語モデル(LLM)は、人工知能の分野で間違いなく大きな話題を呼んでいます。

しかし、すでに本番環境での導入を開始している50社以上の企業と話した結果、LLMがすでに生み出している価値は計り知れません。私たちは、人々が日々新しいユースケースを発見するにつれて、LLMの利用は拡大する一方だと考えています。

LLMs are used to classify, search, generate, cluster, summarize, rewrite and extract
すでに価値を生み出しているLLMのユースケース(画像提供:cohere)

しかし、LLMを本番環境に導入するのは困難です。

大規模言語モデルとOpenAI APIを使って概念実証(PoC)のユースケースを作成するのは簡単ですが、本番環境への導入🚀を考え始めると、さらに多くの考慮事項が必要になります。

ほとんどの企業にとって、LLMを確実に提供するための複雑なGPUインフラを扱うエンジニアリング能力を構築することは、困難で時間のかかる作業です。さらに、ほとんどの企業は、それぞれのユースケースに最適な特定のモデルを求めており、そのためにはこれらのモデルをファインチューニングする必要があります。これは技術的に困難であると同時に、費用のかかることでもあります。

Common Problems in the Productionisation of Large Language Models (LLMs)
大規模言語モデル(LLM)の実運用化におけるよくある課題

オープンソースLLMを素早く展開!

LLMの未来について、私たちはオープンソースモデルが今後の主流になると考えています。このトピックに関する私たちの見解については、さらに詳しく こちら。私たちは、急速に進化するイノベーターコミュニティの力を活用し、企業が組織内でこれらのオープンソースLLMの価値を最大限に活用できるよう支援することにしました。

TrueFoundryは、特定のユースケースに合わせてファインチューニングされたオープンソースLLMが、パートナー企業の組織にもたらすことができる最大限のメリットを享受できるよう願っています。

  1. コスト効率:OpenAI APIを使用するよりも5〜10分の1のコスト
  2. 完全なデータプライバシー:自社のクラウド/オンプレミスKubernetesクラスター上で
  3. 完全なコントロール:ファインチューニング、ロールバックなど

しかし、自社のインフラでオープンソースモデルを管理・展開するのは容易ではありません。一方、 オンプレミスLLMの展開 は、比類のないデータ制御、コンプライアンス対応、長期的なコスト効率を提供しますが、GPUオーケストレーション、Kubernetes管理、モデル最適化に関する深い専門知識が必要です。

しかし、データを取り込んで数回クリックするだけで、それが実現できるとしたらどうでしょう?

私たちは、企業がLLMの概念実証(PoC)から本番環境への移行で直面する課題を理解しています。私たちは、このプロセスをパートナー企業にとって非常に簡単にするレイヤーを構築することを目指しています。その方法をご紹介します。

モデルカタログのご紹介

TrueFoundryの モデルカタログ は、ワンクリックでデプロイできる人気のオープンソース大規模言語モデル(LLM)の集積所です。ユーザーはモデルカタログから直接モデルをファインチューニングすることもできます。

この カタログ は、ほとんどの人気モデルをすでにサポートしており、毎日さらに多くのモデルのサポートを追加しています。お客様自身のクラウドにすでにデプロイできる人気モデルの一部をご紹介します:

  1. Pythia-70M
  2. Vicuna 7B 1.1 HFと Vicuna 13 B 1.1 HF
  3. Dolly V2 7BDoly V2 12B
  4. Flan T5 XL
  5. Alpaca 7BAlpaca 13B

その他多数.....

私たちがオープンソースLLMにもたらす魔法 🪄

企業が初日から製品を出荷できることにこだわっています。これを可能にするために、私たちがLLM機能構築の基盤としている原則をご紹介します:

  1. コスト最適化: パフォーマンスを犠牲にすることなくリソース利用率を最大化し、インフラ費用を削減します。
  2. デプロイの簡素化: コンテナ化とKubernetesを活用してLLMのデプロイを効率化し、シームレスなスケーラビリティと高可用性を実現します。
  3. インフラ管理: GPU割り当てやKubernetes管理といった複雑なタスクを処理し、企業がLLMの最適化に集中できる環境を提供します。
  4. 構築済み抽象化: 既存のワークフローへのLLMの簡単な統合を可能にする既製のソリューションを提供し、カスタム開発の必要性を排除します。
  5. モデルスケーリングのサポート: あらゆるサイズと種類のLLMのスケーリングを可能にし、最高のパフォーマンスと効率を実現します。

ℹ️

UIでのトレーニングおよびファインチューニングのフローに関する詳細な手順については、以下を参照してください。 このYouTube動画

チュートリアル: 3クリックでLLMをデプロイ。

LLMのデプロイは、たった3回のクリックで完了します!

  • 希望のモデルを選択: TrueFoundryで利用可能な様々なオープンソース言語モデルから選択してください。お客様のユースケースに最適なモデルを提案します。(タスクごとのベンチマークは近日公開予定です!)特定の問題やユースケースに最適なモデルを選択し、デプロイボタンをクリックしてください。
  • 適切なリソースを選択: モデルに割り当てるリソースを確認してください。TrueFoundryは、各モデルに最適化された厳選されたハードウェアオプションを提供しており、選択したモデルと相性の良い意思決定プロセスを簡素化します。
  • モデルをデプロイ: モデルとデプロイ環境を選択したら、「送信」ボタンをクリックするだけです。TrueFoundryが、インフラのセットアップ、モデルの構成、推論の準備といった舞台裏のタスクをすべて処理します。

🚀

モデルがデプロイされました!

推論を開始 モデルAPIエンドポイントを使用して。TrueFoundryは、 OpenAPIインターフェース でモデルをテストし、アプリケーション内でモデルを呼び出すためのサンプルコードを提供します。

TrueFoundryでDolly V2をデプロイ(3クリックで!)

チュートリアル:TrueFoundryで大規模言語モデルをファインチューニングする

ほとんどの企業は、特定のユースケースに合わせてファインチューニングされたモデルを使用したいと考えるでしょう。TrueFoundryでモデルをファインチューニングするには:

  1. 希望のモデルを選択: カタログから使用したいモデルを選択します。モデルを選択したら、「ファインチューニング」ボタンをクリックしてプロセスを開始します。
  2. 適切なリソースを選択: ファインチューニングタスクに推奨されるリソースを事前に設定しています。設定の変更により負荷が高まると予想される場合、ユーザーはこれを変更できます。
  3. ファインチューニングジョブをデプロイ: モデルと希望のリソースを選択したら、「送信」ボタンをクリックします。TrueFoundryは、インフラストラクチャのセットアップとトレーニングジョブの設定に関わる舞台裏のタスクを処理します。ファインチューニングジョブが開始され、指定されたハードウェアリソースが利用されます。

🚀

モデルのファインチューニングが開始されました!

ファインチューニングの 監視が可能です。 進捗状況は、ジョブ実行タブで確認できます。そこでは、損失メトリクス、トレーニング曲線、評価結果など、トレーニングジョブに関連するすべての情報を表示できます。これにより、ファインチューニングプロセスを追跡し、ジョブのパフォーマンスに基づいて情報に基づいた意思決定を行うことができます。

今後の展開は?

大規模言語モデル(LLM)と生成AIに関する私たちの取り組みは、まだ始まったばかりです。今後、さらに多くのものを構築していく予定ですので、最新情報をお届けしていきます!

チャットで話しましょう

私たちも、他の皆さんと同様に、この分野についてはまだ学習段階にあります。もし貴社で大規模言語モデルの活用をご検討されているのであれば、ぜひお話しし、情報交換させていただければ幸いです。

☕️を飲みながらお話ししませんか?

The fastest way to build, govern and scale your AI

Sign Up
Table of Contents

One Gateway for Every LLM, Agent and MCP Server

Book a 30-min with our AI expert

Book a Demo

The fastest way to build, govern and scale your AI

Book Demo
Summarize with
ChatGPT logo by OpenAI
Perplexity AI logo
Blurry red snowflake on white background, symmetrical frosty design with soft edges and abstract shape.

Discover More

November 5, 2025
|
5 min read

エージェンティックAI時代におけるデータレジデンシー:AIゲートウェイはいかに主権的規模とコンプライアンスを実現するか

October 5, 2023
|
5 min read

<Webinar> 企業向け生成AIショーケース

Best Fine Tuning Tools for Model Training
May 3, 2024
|
5 min read

モデルトレーニング向けファインチューニングツール主要6選:2026年版

July 20, 2023
|
5 min read

LLMOps CoE: MLOpsランドスケープにおける次のフロンティア

OpenRouter vs AI Gateway
July 4, 2026
|
5 min read

OpenRouter 対 AIゲートウェイ:どちらがあなたに最適ですか?

comparison
July 4, 2026
|
5 min read

プロンプトエンジニアリング:LLMとの対話方法を学ぶ

Thought Leadership
LLMs & GenAI
July 4, 2026
|
5 min read

True ML Talks #12 - Llama-Index共同創設者

True ML Talks
July 4, 2026
|
5 min read

AIワークロードがクラウド料金を膨らませていませんか?

Thought Leadership
No items found.

Recent Blogs

Black left pointing arrow symbol on white background, directional indicator.
Black left pointing arrow symbol on white background, directional indicator.
Take a quick product tour
Start Product Tour
Product Tour