AI/BI Genieは、ビジネスチームが自然言語を通じて自分たちのデータからインサイトを得るための会話型ツールです。Genie は生成 AI を活用して、組織のデータ、利用パターン、ビジネス概念に合わせてカスタマイズされ、ユーザーからのフィードバックを通じて継続的に学習します。これにより、技術的な知識がないユ ーザーでも、経験豊富な同僚に質問するように質問でき、企業データから直接関連性の高い正確な回答を得られます。
Genie スペースの利用が増える中、提供されるインサイトの正確性に対する信頼がユーザーにとって重要です。この信頼が、Genie のインサイトを基に最も適切な意思決定を行うために必要な要素となります。
ビジネスチーム向けに Genie スペースの作成や管理を担うデータ担当者がよく挙げる重要な要件は以下の 2 点です:
- Genie スペース内で管理する指示や例が全体の精度向上に有効であることを確認できること。
- 必要に応じて、Genie が生成する回答が正確であるかを確認し、そのフィードバックをエンドユーザーに伝えられること。
これらの要件に応えるために、Genie の回答精度に対する信頼を強化する 2 つの新機能を導入します:
- ベンチマーク - Genie 作成者はテスト質問を作成し、Genie スペースの指示や設定を更新するたびに全体の精度を追跡できます。
- レビューをリクエストする - エンドユーザーは、Genie 作成者に回答の確認や修正を依頼し、その確認を受け取れるようになります。
ベンチマーク
ベンチマーク機能により、Genie 作成者は自分の Genie スペースの精度を体系的に評価できるようになります。効果的なベンチマーク質問セットには、ユーザーから最も頻繁に尋ねられる質 問と、その表現を 2〜3 種類変えたバリエーションが含まれているべきです。作成者はこれらのベンチマークを定期的に実行することで、スペースの編集が全体の精度向上に有効であるかを確認できます。
ベンチマークの使用方法
Genie スペースの精度をベンチマークでより適切に評価するためには、次の手順に従ってください:
- 準備: Genie スペースにクリーンなテーブルやメタデータが含まれていることを確認します。最初に、一般的なユーザーの質問をいくつか手動でテストし、基礎の精度を向上させる指示を追加します。
- ベンチマークの追加: 追加するベンチマークには、ユーザーがよく尋ねる質問の異なる表現やバージョンを反映させましょう。たとえば、ユーザーが「今年の売上上位 10 顧客」をよく尋ねる場合、「FY2024 の売上上位 10 顧客」や「今年の売上トップ 10 顧客を教えて」といった異なる表現でベンチマークを作成します。そして、そのベンチマーク質問に正確に答える SQL 文を追加します。これにより、評価機能が各質問の回答を「正解」と比較できるようになります。
-
ベンチマークの実行と評価: 代表的なベンチマークセットを構築したら、「Run Benchmarks」をクリックして、Genie が全てのベンチマーク質問に対して自動評価されるようにします。各質問には「正解」または「要レビュー」の評価ラベルが付きます。Genie のクエリ結果がベンチマークのクエリ結果と完全に一致した場合、その質問は「正解」としてマークされます。
-
改善: 特定の質問をダブルクリックして、Genie に改良が必要な点を確認します。Genie スペースが苦手としている具体的な質問を特定したら、改善を行います。たとえば、「アジア地域でのベストセールス担当者」を計算する方法を Genie に教える指示が必要だと気づいた場合、指示ページに移動して、適切な回答方法を示す SQL クエリの例を追加します。
- ベンチマークの再実行: スペースの指示を改善した後、ベンチマークセットを再実行して、全体の精度が向上したかを確認します。その後、Evaluations タブで Genie スペースの精度を時系列で追跡できます。エンドユーザーからよく質問される内容を把握したら、さらにベンチマーク質問を追加していきましょう。
リクエストレビュー
Genie は、非技術ユーザーが専門家に頼ることなく、データから新たなインサイトを得るために追跡質問を行える強力な探索的データ分析ツールです。しかし、Excel のような他のツールでの分析と同様に、結果を事実として発表する前にセカンドオピニオンを求めたくなることもあるでしょう。
Request Review 機能により、エンドユーザーは Genie 内で直接レビューサイクルを完結できます。これにより、Slack や Teams でのスクリーンショットのやり取りが不要になります。
リクエストレビューの使い方
- Request ボタンをクリック: ユーザーが確認したい回答を受け取った際には、リクエストアイコンをクリックしてレビューを開始できます。リクエストの際、Genie スペース の管理者に向けて依頼内容を説明するコメントを追加することをお勧めします。
- 管理者レビュー: リクエストが送信されると、Genie スペースの管理者は履歴ページでリクエストを確認できます。元のプロンプト、生成された SQL、および添付されたコメントを確認し、SQL を正確とマークするか、ビジネスユーザー向けに修正することが可能です。
- リクエスト者への通知: 管理者が生成された SQL を確認または修正した後、エンドユーザーにその検証結果が通知されます。エンドユーザーは履歴ページの自分のビューでこれを確認できます。
まとめ
ベンチマークとリクエストレビュー機能の導入により、AI/BI Genie はユーザーが受け取る回答の正確性と信頼性を大幅に向上させます。ベンチマーク機能では、指示の修正が効果を上げているかを確認しながら、精度の改善を時間とともに体系的に追跡できます。また、リクエストレビュー機能により、ユーザーは重要な回答を簡単に確認でき、Genie が生成するインサイトへの信頼感が深まります。これらの新機能により、ビジネスチームは日々の業務で必要な重要な意思決定を自信を持って Genie に委ねることができます。
まだ Genie スペースを作成していない方は、ぜひ始めてみてください。AI/BI Genie ドキュメントをよくお読みいただき、AI/BI ダッシュボードと Genie のデモと製品ツアーで実際の使用例をご覧ください。
Databricks チームは AI/BI Genie の改善を常に目指しており、皆様のフィードバックをお待ちしています!