メインコンテンツへジャンプ

モデルトレーニング

独自の LLM ・生成 AI モデルの微調整と事前トレーニング

Mosaic AI モデルトレーニングを使用して、オープンソースの LLM を微調整したり、企業データに基づいてカスタム LLM を構築できます。モデルトレーニングで構築されたカスタムモデルは、より高速で、高品質かつドメイン特化型の結果を生成し、商業用 LLM と比較して最大 10 倍のコスト削減が可能です。

A complex image with various elements, including text, diagrams, and charts.

高精度

オープンソースの LLM を微調整したり、企業データを使って新しい LLM を構築したりすることは、ビジネスをより意味的に理解することにつながり、精度の高い回答を提供します。Mosaic AI モデルトレーニングは Databricks でネイティブに利用できるため、企業はデータを移動することなく、簡単かつ安全にモデルの微調整や構築を行うことができます。また、ガバナンス、監査可能性、トレーサビリティ、モニタリングも確保し、モデルが正しい方法で使用され、正しいレスポンスを提供していることを確認します。その結果、ビジネスの状況に特化した、より高品質で正確な結果が得られます。

Pretraining compute plane graphic image

容易なスケーリング

高性能 LLM トレーニングの重要な要素はスケーラビリティであり、それには高速で低レイテンシのネットワークと最高性能の GPU へのアクセスが必要です。Mosaic AI Training を使用すると、NVIDIA InfiniBand ネットワーキングとNVIDIA H100 Tensor Core GPU の両方を自動的に利用できるようになります。これにより、大規模なモデル(700 億以上のパラメータ)を容易にトレーニングし、トレーニングの実行を数時間から数日で完了できます。

Pretraining shows it can train a Stable Diffusion model for 10x less cost

費用対効果

Mosaic AI モデルトレーニングは、より小さなオープンソースの生成AI大規模言語モデル(LLM)を微調整して、高効率のモデルを生成することができます。これにより、大きなプロプライエタリ(商業用)LLMと比較して、最大5倍コスト効果の高いモデルを提供できます。さらに、最適化されたソフトウェアスタックを使用して、ゼロから新しいLLMを構築することも可能です。システムレベルの最適化、調整された並列処理戦略、モデルトレーニングの科学の組み合わせにより、トレーニングコストが 10 分の 1 になります。

model training architecture

セキュリティとコンプライアンス

ほとんどの組織にとって、セキュリティは最優先案件であり、従業員がデータをサードパーティの API に送信し、データが流出したり、公開モデルのトレーニングに使用されたりするリスクを負うことは許されません。Mosaic AI モデルトレーニングでは、このような心配は無用です。組織は、独自の LLM を構築し、所有権を保持するため、データとモデルの両方を完全に制御できます。デフォルトでは、トラフィックやすべてのトレーニングデータを含め、全てが暗号化されたままです。これにより、完全なデータプライバシーと完全なモデルオーナーシップが保証され、あらゆる規制コンプライアンスを満たすことができます。

Ready to get started?