MLflow AI Gatewayの発表

強力なLLMアーキテクチャとインターフェースツールの提供

Published: July 25, 2023

Arpit Jasapara、ベン・ウィルソン、Corey Zumar、Harutaka Kawamura、ミンギュ・リー、Vladimir Kolovski、Zhe Wang による投稿

翻訳：Junichi Maruyama. - Original Blog Link

大規模言語モデル（LLM）は、SQLウェアハウスに保存されたテキストデータのセンチメント分析から、製品に関するニュアンスの異なる質問に回答するリアルタイムのチャットボットの導入まで、ビジネス価値を提供する幅広い潜在的なユースケースを解き放ちます。しかし、これらのアプリケーションのために強力なSaaSやオープンソースのLLMへのアクセスを民主化するには、セキュリティ、コスト、データ関連のさまざまな課題が伴います。例えば、企業全体で SaaS LLM API トークンを効果的に管理するという具体的な課題を考えてみよう：

チームがAPIトークンをプレーンテキストとして通信に貼り付けることによるセキュリティの問題
共有キーがアプリケーションのクラッシュやレート制限の乱用によるコストのピークにつながるというコストの問題
各チームがガードレールなしで独自のAPIトークンを管理することによるガバナンスの問題

これらの課題は、組織がイノベーションのためにLLMプロバイダー（OpenAI、Anthropic、オープンソースモデルなど）へのアクセスを拡大することを阻害する。さらに、最新のモデルを使用してビジネス上の問題を迅速に解決するために、データアナリストとデータサイエンティストは、標準的なインターフェイスで最先端のLLMにアクセスする必要があります。

本日、MLflow 2.5のAI Gatewayコンポーネントのプレビューを発表できることを嬉しく思います。MLflow AI Gatewayは拡張性の高いエンタープライズグレードのAPIゲートウェイで、組織がLLMを管理し、実験や本番ユースケースで利用できるようにします。LLMの認証情報やデプロイメントの一元管理、チャットや完了などの一般的なタスクのための標準化されたインターフェイス、複数のSaaSやオープンソースのLLMとの統合などの機能を備えています。AIゲートウェイを利用することで：

組織は、開発から運用に至るまでLLMを安全に保護することができます。
データアナリストは、コスト管理のガードレールを使ってLLMを安全に照会できます。
データサイエンティストは、さまざまな最先端のLLMをシームレスに試して、高品質のアプリケーションを構築できます。
MLエンジニアは、複数のデプロイメントにわたってLLMを再利用することができます。

AIゲートウェイの使用方法については、続きをお読みください。

AI Gateway RoutesによるLLMへの安全なアクセス

各ユースケースやアプリケーションが必要なモデルに確実にアクセスできるようにすることは重要ですが、コストを管理し、セキュリティ侵害を防ぐためには、このアクセスを体系的に管理・制限することも重要です。AIゲートウェイは、組織内の各チームがそれぞれのSaaS LLM認証情報を管理するのではなく、ガードレールを備えたLLMテクノロジーへの集中アクセスを可能にします。つまり、組織全体で各SaaS LLMの「開発」キーと「本番」キーを管理し、ユーザーとサービス料金の上限を設定することができます。

AIゲートウェイは、ルートを通じてこの集中アクセスを提供します。Routeは特定のベンダー（OpenAI、Anthropic、Hugging Faceなど）のLLMを表し、関連する認証情報と設定を定義します。組織はユースケースごとにRouteを作成し、必要に応じてデータアナリスト、データサイエンティスト、プロダクションアプリケーションなどのコンシューマーにアクセスを委譲することができます。コンシューマは標準的なインタフェースの背後でこれらのルートにクエリできますが、クレデンシャルやコンフィギュレーションに直接アクセスすることはできません。

次のコード・スニペットは、MLflow Python クライアントを使用して AI Gateway Route を簡単に作成し、クエリできることを示しています：

AI Gateway は、Databricks Model Serving にデプロイされたオープンソースモデルもサポートしており、複数のアプリケーションで LLM を再利用することができます。以下のコードスニペットは、オープンソースの MPT-7B-Chat モデルを持つ Databricks Model Serving エンドポイントを使用して、テキスト補完の AI Gateway Route を作成し、クエリを実行します：

Routes の詳細については、MLflow AI Gateway のドキュメントを参照してください。

MLflow AI Gatewayを使い始める

Databricks上のMLflow AI Gatewayをお試しいただくことで、LLMのユースケースを安全かつ高速化することができます！既存の Databricks ユーザーの方は、Databricks 担当者にご連絡の上、AI Gateway Private Preview にご登録ください。まだ Databricks ユーザーでない方は、databricks.com/product/managed-mlflow で詳細をご覧いただき、Databricks と Managed MLflow の無料トライアルを開始してください。オープンソースのMLflow AI Gatewayや、MLflow 2.5に含まれるその他の機能や改善点についての詳細は、release changelogをご覧ください。

次は何ですか？

Harnessing the Power of Databricks Mosaic AI for Rolls-Royce

August 7, 2024/1分未満

ロールスロイスの画像生成に Databricks Mosaic AI のパワーを活用する

Turbocharging GPU Inference at Logically AI

October 22, 2024/1分未満

MLflow AI Gatewayの発表

強力なLLMアーキテクチャとインターフェースツールの提供

AI Gateway RoutesによるLLMへの安全なアクセス

最新かつ最高のLLMを標準インターフェースで使用

MLflow AI Gatewayを使い始める

次は何ですか？

ロールスロイスの画像生成に Databricks Mosaic AI のパワーを活用する

Logically AIでGPU推論をターボチャージ！

AI Gateway RoutesによるLLMへの安全なアクセス

最新かつ最高のLLMを標準インターフェースで使用

MLflow AI Gatewayを使い始める

Databricksの投稿を見逃さないようにしましょう

Sign up

次は何ですか？

ロールスロイスの画像生成に Databricks Mosaic AI のパワーを活用する

Logically AIでGPU推論をターボチャージ！