Articles by アキル・グプタ - Databricks ブログ

ページ 1

LilacがDatabricksに参画：生成AIの非構造化データ評価をシンプル化

March 19, 2024 Matei Zaharia、ナヴィーン・ラオ、ジョナサン・フランクル、ハンリン・タン、アキル・グプタによる投稿 in Databricks ブログ

本日、LilacがDatabricksに参画することを発表できることを嬉しく思います。 Lilacは、データサイエンティストが生成AIを中心にあらゆる種類のテキストデータセットを検索、クラスタリング、分析するためのスケーラブルでユーザーフレンドリーなツールです。 Lilacは、大規模言語モデル（LLM）の出力の評価から、モデルのトレーニングのための非構造化データセットの理解と準備まで、さまざまなユースケースに使用できます。 LilacのツールをDatabricksに統合することで、顧客は自社の企業データを使用した生産品質の生成AIアプリケーションの開発を加速させることができます。生成AI時代のデータ探索と理解データは、モデルのトレーニングのためのデータセットの準備、モデルの出力の評価、RAG（Retrieval-Augmented Generation）データのフィルタリングなど、LLMベースのシステムの中核をなすものです。これらのデータセットを探索し理解することは、質の高い生成AIアプリを構築する上で非常

Databricks Feature Serving（特徴量サービング）の一般提供開始のお知らせ

March 11, 2024 アクラティ・タラティ、マニ・パークヘ、チェネン・リャン、ジャスラジ・ダンゲ、葛明陽、アキル・グプタによる投稿 in データサイエンス・ML

本日、Databricks Feature Serving（特徴量サービング）の一般提供を開始いたします。特徴量はAIアプリケーションにおいて極めて重要な役割を果たし、通常、正確に計算し、低レイテンシーでアクセスできるようにするためにはかなりの労力を必要とします。この複雑さによって、本番のアプリケーションの品質を向上させるための新機能の導入が難しくなります。特徴量サービングを利用すれば、AIアプリケーションに対して、単一のREST APIを使用してリアルタイムで、事前に計算された特徴量やオンデマンドの特徴量を簡単に提供することができます！特徴量サービングは、高速で安全、かつ簡単に使用できるように設計されており、次のような利点があります：高速かつ低TCO - 特徴量サービングは、低TCOで高いパフォーマンスを提供するように設計されており、ミリ秒単位の待ち時間で特徴量を提供できます。フィーチャーチェーン - 事前に計算された特徴量とオンデマンド計算のチェーンを指定することで、複雑なリアルタイム特徴量の計算

Databricks Vector Search パブリックプレビューのご紹介

December 7, 2023 アキル・グプタ、セルゲイ・ツァレフ、エリック・ピーターによる投稿 in エンジニアリングのブログ

昨日発表した RAG(Retrieval Augmented Generation )に続き、本日、Databricks Vector Searchのパブリックプレビューを発表します。6月に開催されたData + AI Summitでは、限られたお客様を対象としたプライベートプレビューを発表しましたが、今回はすべてのお客様にご利用いただけるようになりました。Databricks Vector Searchは、PDF、Officeドキュメント、Wikiなどの非構造化ドキュメントに対する類似検索を通じて、開発者がRAG（Retrieval Augmented Generation）や生成AIアプリケーションの精度を向上させることを可能にします。Vector Search は Databricks Data Intelligence Platform の一部であり、RAG およびジェネレーティブ...