私たちの顧客は、生成型AIを試験から本番環境へ移行させる最大の課題は「測定問題」だと言っています。これらのシステムを測定し、信頼するのは難しいです。LLMプロバイダーは制御テストでのパフォーマンス結果を共有しますが、企業はモデルを変更し、自身のデータを追加します。これにより、現実世界での評価が難しくなります。
現在のAIの状況では、ほとんどの組織が単一の呼び出しLLMアプリケーションからAIシステムへと移行しています。これらのシステムは、複数のツール、検索戦略、推論ステップ、ビジネスルール、およびLLMを使用して、ユーザープロンプトから単一の出力を生成します。フードの下ではたくさんのことが進行中です。
Databricksでは、顧客のデータと、そのビジネスのユニークな特性に合わせて調整された強力なAIモデルを組み合わせることで、分析とインテリジェントアプリケーションへのアクセスを民主化しています。私たちは、一般的なインテリジェンスから、私たちがデータインテリジェンスと呼ぶものへのシフトをリードしています。私たちのユーザーが証明しているように、データの品質と効率の小さな改善でも、大きな影響を及ぼすことができます。今年、Databricks Mosaic AIを基盤としたアプリケーションが急増したことを受け、Databricksが顧客の複合システムに対して業界をリードするスケーラブルな評価を提供できることが重要です。
私たちは、AIチーム全体の評価インテリジェンスに焦点を当てたスタートアップ、GalileoのシリーズBの資金調達ラウンドにDatabricks Venturesが投資したことをお知らせすることを嬉しく思います。そして、この深いパートナーシップにより、現在、すべてのDatabricksモデルがガリレオユーザーにネイティブで利用可能となり、顧客にデ ータインテリジェンスと評価インテリジェンスの両方を提供します。
なぜガリレオなのか
ガリレオは、独自の指標と評価基盤モデルのセットであるLuna評価スイートを用いた新しいタイプの評価インテリジェンスを提供します。ガリレオは、Lunaとその意見形成的なワークフローを組み合わせて、実験、監視、リアルタイム保護を可能にし、評価によってチームを強化します:
- AI開発ワークフロー全体をカバー
- グラウンドトゥルースデータが必要なく、そのまま使えます。
- コストや遅延の影響を受けずに、月に数百万のAIクエリをスケールアップ
- エンジニア、開発者、ビジネスユーザーにとって同等に有用です
- あなたのユースケースに特有のデータに自動的に適応して、継続的に改善します
これにより、チームは信頼性の高いアプリケーションを迅速に出荷し、一貫した出力と内部および外部ユーザーに対するポジティブなブランド体験を確保することができます。ガリレオは、Fortune 50のDatabricksの顧客との既存の関係を含むエンタープライズ全体で実績を持っており、昨年に比べてビジネス成長率が800%以上に達しています。
GalileoとDatabricksの次のステップは何か
ガリレオは現在、Unityカタログ、Databricksマーケットプレイス、およびMosaic AIモデルサービスから、Databricksの最新世代の高品質な事前学習済み基盤モデルを提供しています。Databricksで利用可能なすべての既製品および微調整モデルは、ネイティブ統合を通じてGalileoでの評価を強化するためにアクセスできるようになりました。これには、あなたのOAuth Databricksの資格情報だけが必要です。この統合により、ユーザーはデータインテリジェンスと評価インテリジェンスの両方の最良の部分を一つのエコシステムの一部として得ることができます。
これは、DatabricksとGalileoとのデータインテリジェンスへの移行の最初のステップに過ぎません。将来的に、ガリレオはDatabricksのデータレイヤーと統合することで、評価と効率的なRLHFのための自動アルゴリズムによる高品質なテストセットと微調整データセットの作成を可能にし、全体のエコシステム内でネイティブに開発ループを閉じる予定です。
これらの統合を展開することに興奮しています - 共同ソリューションを今すぐ始めるために、興味を登録するためにここから連絡してください。今後のアップデートをお楽しみにし、AI評価の未来についてもっと学ぶために、10月29日にDatabricksとGalileoチームに参加して、GenAI Productionize 2.0バーチャルサミットに参加してください。