メインコンテンツへジャンプ

RAGの精度向上へ:Databricks VenturesがVoyage AIに出資

アンドリュー・ファーガソン
マーガレット・アモーリ
マリア・ペレ-ペレス
Share this post

私たちが顧客から頻繁に聞くのは、生成AIアプリケーションをパイロットから本番環境に移行する際の課題の1つが、既製の大規模言語モデル(LLM)が生成する結果の正確性であるということです。この正確性のギャップを埋めるために、企業が取り組んでいる方法の1つが、Retrieval Augmented Generation(RAG)アーキテクチャを含む「複合AIシステム」を構築することです。RAGアーキテクチャや複合AIシステムでは、企業や特定分野のデータをプロンプトや応答の一部として取り入れることで、既製のLLMの応答の質を向上させます。Databricksでは、これをLLMの「一般知能」から「データ知能」へのシフトと捉えており、わずかなリトリーバルの質や効率の向上でも、ユーザー体験に大きな影響を与えることができると考えています。

高品質な埋め込みモデルは、正確なRAGシステムの礎です。今年、DatabricksのMosaic AI上で開発されたRAGアプリケーションが急増している中、Databricksが業界トップクラスの埋め込みおよびリランクモデルを提供できることが重要です。そのため、Databricks Venturesは深層学習の先駆者であるCEO Tengyu Ma氏が共同設立したスタートアップ、Voyage AIのシリーズA資金調達に出資しました。

さらに、Databricksの顧客向けに、Voyageのリランクおよび埋め込みモデルをMosaic AI Model Servingに提供する新たなパートナーシップも発表しています。Voyage AIとの協業により、データインテリジェンスと高品質な本番AIシステムの構築を支援していきます。

なぜVoyage AIなのか

Voyage AIは、現在利用可能な世界最高クラスの埋め込みモデルを提供しています。高品質な埋め込みとリランクモデルにより、企業はRAGの検索・リトリーバルの正確性と効率を向上させ、より正確なRAGソリューションや複合AIシステムを実現できます。また、Voyage AIのモデルは特定分野に最適化され、企業のデータに合わせて調整されているため、多くの大手AI企業が一流のユーザー体験を提供するために利用しています。

Voyage AIとDatabricksの次のステップは?

Voyage AIの最新世代の埋め込みおよびリランクモデルを、Mosaic AI Model Servingソリューション内にネイティブに提供する予定です。このモデルをネイティブで提供することで、Databricksの顧客は、安全でコスト効果の高い本番品質のRAGアプリケーションを構築でき、Databricksがエンタープライズに必要な長期的なサポートと安定性を提供することで、安心して利用できます。

今後数か月以内に、Mosaic AIとのVoyage AIモデルの統合を発表する予定です。お楽しみに!

Databricks 無料トライアル

関連記事

LilacがDatabricksに参画:生成AIの非構造化データ評価をシンプル化

本日、LilacがDatabricksに参画することを発表できることを嬉しく思います。 Lilacは、データサイエンティストが生成AIを中心にあらゆる種類のテキストデータセットを検索、クラスタリング、分析するためのスケーラブルでユーザーフレンドリーなツールです。 Lilacは、大規模言語モデル(LLM)の出力の評価から、モデルのトレーニングのための非構造化データセットの理解と準備まで、さまざまなユースケースに使用できます。 LilacのツールをDatabricksに統合することで、顧客は自社の企業データを使用した生産品質の生成AIアプリケーションの開発を加速させることができます。 生成AI時代のデータ探索と理解 データは、モデルのトレーニングのためのデータセットの準備、モデルの出力の評価、RAG(Retrieval-Augmented Generation)データのフィルタリングなど、LLMベースのシステムの中核をなすものです。 これらのデータセットを探索し理解することは、質の高い生成AIアプリを構築する上で非常

Databricks + Tabular

私たちは、データマネジメント会社であるTabular, Incを買収することに合意したことを発表できることを非常に嬉しく思います。この会社はRyan Blue、Daniel Weeks、Jason Reidによって設立されました。この買収により、Apache Iceberg™のオリジナルの作成者と、Linux Foundation Delta Lakeの作成者たちが一堂に会することになります。これにより、データの形式に縛られることなくデータ互換性を実現するための道が開かれます。本ブログでは、短期的にはDelta Lake UniForm内で、長期的には単一でオープンかつ共通の相互運用性の標準へと進化させることを目指し、IcebergおよびDelta Lakeコミュニティと緊密に連携してフォーマット互換性を実現する方法について説明します。取引が完了次第、このチームを迎えることを楽しみにしており、オープンレイクハウスのビジョンに向けて共同で取り組むことに興奮しています。 レイクハウスアーキテクチャの台頭とフォーマット
Databricks ブログ一覧へ