LLM・AIモデルのトレーニングとファインチューニング

TrueFoundryはSeldon AIの買収を発表し、エンタープライズAI向けコントロールプレーンを拡張します。プレスリリース全文はこちら→

どんなモデルでもファインチューニング

Hugging Faceの統合機能と本番環境対応テンプレートを使用して、LLMと従来のMLモデルをファインチューニングします

ノーコードまたはフルコードのファインチューニング

ノーコードUIですばやく開始するか、完全な制御と柔軟性のために独自のトレーニングスクリプトを持ち込むことができます。

PEFTとフルファインチューニング

コスト、メモリ使用量、モデル性能のバランスを取るために、LoRA、QLoRA、およびフルファインチューニングをサポートします。

チェックポイントとバージョン管理

実行を自動的にチェックポイントし、トレーニングを再開し、再現性のためにモデルとデータセットをバージョン管理します。

組み込みの実験トラッキング

ファインチューニングの実行全体で、ハイパーパラメータ、メトリクス、データセット、出力を追跡します。

アダプター管理

LoRAアダプターをトレーニング、再利用、マージ、切り替えることで、ファインチューニングを高速化し、コストを削減します。

Purple gradient square with white background, shiny surface, and rounded corners in rhombus shape.

あらゆるHugging Faceモデル / 従来のMLモデルをファインチューニング

LLaMA、Mistral、BERT、Falcon、GPT-JなどのLLMのファインチューニングに対応
内蔵のHugging Faceモデルハブを使用して、数分でLLMのファインチューニングを開始できます
事前設定されたテンプレートにより、大規模言語モデルのファインチューニングプロセスが簡素化されます
小規模な実験から本番環境レベルのLLMファインチューニングまで、スケーラブルなインフラがすべてを処理します

詳細を見る

ノーコードかフルコードか — 選択はあなた次第

迅速なセットアップと高速なイテレーションを実現するノーコードUIでLLMをファインチューニング
コードモードで完全に制御しながら、独自のトレーニングスクリプトを持ち込む
インフラストラクチャとリソースのスケーリングを自動的に管理
組み込みのログ、メトリクス、バージョン管理により、各ファインチューニング実行の完全な透明性を確保。

PEFT（LoRA / QLoRA）およびフルファインチューニングのサポート

パラメータ効率の良いファインチューニング（LoRA、QLoRA）およびフルモデルファインチューニングをサポート
大規模LLMのより高速で費用対効果の高いファインチューニングのために、LoRAまたはQLoRAを選択
モデルの品質とパフォーマンスを維持しながら、GPUメモリ使用量を削減
モデルサイズ、コスト、ワークロードのニーズに基づいて、適切なファインチューニングアプローチを選択

チェックポイント管理とバージョン管理

ファインチューニング中にチェックポイントを自動的に保存し、トレーニングの進行状況の損失を防ぐ
中断または一時停止されたファインチューニングジョブを任意のチェックポイントから再開
完全な再現性のために、モデル、データセット、トレーニング実行をバージョン管理
以前のチェックポイントにロールバックし、バージョン間でパフォーマンスを比較

組み込みの実験追跡

すべてのトレーニングメタデータ（ハイパーパラメーター、メトリクス、データセット、出力）を自動ログ
複数の実行を比較して、LLMをより効果的にファインチューニングします
お使いのLLMopsスタックと統合するか、当社のネイティブビジュアルインターフェースをご利用ください
組み込みのバージョン管理により、再現性と監査可能性が保証されます

効率的なLLMファインチューニングのためのアダプター管理

わずかなパラメーターセットのみを更新することで、LoRAアダプターを活用してモデルをファインチューニングします。
プロジェクトやドメインを超えて事前学習済みアダプターを再利用
異なるタスク間でアダプターをマージまたは切り替えることで、迅速な実験とモジュール式のモデル設計が可能になります
完全なLLMウェイトの代わりにコンパクトなアダプターモジュールをトレーニングすることで、トレーニングを高速化し、コストを削減

データとインフラの統合

S3、GCS、Azure Blob、またはHugging Face Datasetsからデータセットをインポート
フルマネージドインフラストラクチャまたは独自のクラスターでファインチューニングジョブを実行
クラウド、ハイブリッド、オンプレミス環境にわたってワークロードをデプロイ
GPUオートスケーリング、タイムスライシング、コスト効率の良いプロビジョニングをデフォルトで使用

大規模な実世界AI向け

99.99%

稼働率

一元化されたフェイルオーバー、ルーティング、ガードレールにより、モデルプロバイダーがダウンしても、AIアプリはオンライン状態を維持します。

100億以上

月間処理リクエスト数

本番AI向けのスケーラブルで高スループットな推論。

30%

平均コスト最適化

スマートルーティング、バッチ処理、予算管理により、トークンの無駄を削減します。

エンタープライズ対応

データとモデルをクラウド/オンプレミスインフラ内に保持する、セキュアなAIゲートウェイを導入。

HIPAA, GDPR, and AICPA SOC compliance badges for data security and privacy regulations standards.

コンプライアンスとセキュリティ
SOC 2、HIPAA、GDPRの各標準により、堅牢なデータ保護を確実にする
ガバナンスとアクセス制御
SSOとロールベースアクセス制御（RBAC）および監査ログ
エンタープライズサポートと信頼性
SLAに基づいた応答SLAを含む24時間年中無休サポート

TrueFoundryをあらゆる環境にデプロイ

VPC、オンプレミス、エアギャップ環境、または複数のクラウドにわたって。

データはお客様のドメイン外に出ることはありません。TrueFoundryが稼働する場所であればどこでも、完全な主権、分離、エンタープライズグレードのコンプライアンスを享受できます。

始める

Cloud deployment options including On-Prem, Multi-Cloud, Air-gapped, and AWS, Google Cloud Platform.

TrueFoundryでの具体的な成果

企業がTrueFoundryを選ぶ理由

3倍

自律型LLMエージェントでより迅速な価値実現

80%

自動エージェント最適化後のGPU‑クラスター利用率向上

Aaron Erickson

Applied AI Lab 創業者

TrueFoundryは、当社のGPUフリートを自律的で自己最適化するエンジンに変えました。これにより、利用率が80 %向上し、アイドル状態のコンピューティングによる数百万ドルのコストを削減できました。

5倍

社内AI/MLプラットフォームのプロダクション化までの時間短縮

50%

ワークロードをTrueFoundryに移行後のクラウド支出削減

Pratik Agrawal

データサイエンス＆AIイノベーションシニアディレクター

TrueFoundryのおかげで、私たちは実験段階から本番環境への移行を記録的な速さで実現できました。1年以上かかるところが数ヶ月で完了し、開発者の採用も向上しました。

80%

モデルのプロダクション投入までの時間短縮

35%

以前のSageMakerセットアップと比較したクラウドコスト削減

Vibhas Gejji

スタッフMLエンジニア

DevOpsの負担を軽減し、チーム全体のプロダクションロールアウトを簡素化しました。TrueFoundryは、実験段階から堅牢なサービスまで拡張可能なインフラにより、MLデリバリーを加速させました。

50%

RAG/エージェントスタックのデプロイを迅速化

60%

RAG/エージェントパイプラインのメンテナンスオーバーヘッドの削減

Indroneel G.

インテリジェントプロセスリーダー

TrueFoundryは、パイプライン、ベクトルDB、API、UIを含む完全なRAGスタックを、セルフホスト型インフラストラクチャを完全に制御しながら、2倍の速さでデプロイするのに役立ちました。

60%

AIデプロイの高速化

~40-50%

開発環境全体での効果的なコスト削減

Nilav Ghosh

AI担当シニアディレクター

TrueFoundryの導入により、デプロイ期間を半分以上短縮し、統合されたMLOpsインターフェースを通じてインフラのオーバーヘッドを削減することで、価値提供を加速しました。

<2

全てのプロダクションモデルを移行するのにかかった週数

75%

データサイエンスの調整時間を削減し、モデルの更新と機能の展開を加速

Rajat Bansal

CTO

インフラコストを大幅に削減し、データサイエンスの調整時間を75%短縮できました。TrueFoundryは、チーム全体のモデルデプロイ速度を向上させてくれました。

よくある質問

LLMファインチューニングとは何ですか？なぜ重要なのでしょうか？

LLMファインチューニングとは、LLaMA、BERT、Mistral、GPT-Jなどの事前学習済み大規模言語モデル（LLM）を、特定のドメイン、データセット、またはタスクに適応させるプロセスです。タスク固有のデータでトレーニングを継続することで、パフォーマンス、精度、文脈的関連性を大幅に向上させることができます。また、ファインチューニングにより、企業は独自の知識を注入し、ビジネスロジックを適用し、規制要件に準拠しながら、サードパーティAPIへの依存を減らすことができます。

TrueFoundryは、自動化、インフラ抽象化、および完全な可観測性を通じて、LLMのファインチューニングを容易にし、本番環境に対応させます。