メインコンテンツへジャンプ

Databricksでは、地球上のすべての人々がデータとAIにアクセスできるようにしたいと考えています。これが、ビジネスユーザーが、SQLを話すこともコードを書くこともなく、信頼できる洞察を迅速かつ正確に得ることができるようにするAI/BIのようなソリューションを構築している理由です。

現在、ダッシュボードはほとんどの人々の日常生活の一部となっています。一方、AI/BI Genieは新しい経験であり、まだ多くの人々が馴染みがないかもしれません。Genieを使用すると、ユーザーは自己サービスで、ダッシュボードで対処されていない質問に対する答えを得ることができ、BIツールの使用方法を学んだり、専門家に洞察を作成してもらうことなく、答えを得ることができます。この背景を踏まえて、ジニーの一日を見てみると、どのように使用するか、何を期待するかを理解するのに役立つかもしれません。

「新入社員」としてのGenieへのオリエンテーション

一部の人々は、Genieを作成するプロセスを、新しいアナリストをデータチームに雇うことに例えています。この新入社員は賢く、学ぶことに熱心ですが、少しロボット的で、あなたの内部の用語、指標、定義、前提についての経験は全くありません。Genieはパブリックな知識に精通していますが、会社内部やチーム内部の知識については非常に無知です。

そこで、最初のステップは、新入社員であるGenieに必要なオリエンテーションを誰かに行ってもらうことです!このブログ投稿では、あなたが経験豊富なアナリストであり、チームのすべての質問を受けて、忙殺されているかもしれないと仮定しています。

Genieのセットアップページは、この新入社員が何を知る必要があるかをガイドし、全ての質問に答える試みを開始するためのものです:

ここでは、Genieを動かすための基本的なことを提供することが目標です:

  • タイトルと説明: 彼らが答えることが期待される質問の範囲と領域は何ですか?これは、Genieのスペースを閲覧し検索できるすべての人に見えるので、これを明確かつ簡潔にすることが重要です。
  • デフォルトのウェアハウス: このジニーは、あなたのためにSQLクエリを実行するためにどのコンピュートを使用しますか?
  • テーブル:Genieが質問に答えるために使用する範囲内のテーブルは何ですか?Genieは各テーブルとその各列のすべてのコメントを読み、これらを答えに反映します。
  • サンプル質問: 必要に応じて、何を尋ねるべきかわからない人々に提示したい例示的な質問を指定することができます。

これらに適切な値を選んだら、「保存」をクリックして新しいGenieをアクションに移す準備をします!

…まあ、そうとも言えませんね。新入社員を訓練する場合、彼らがあなたのチームの最も難しい質問に答える前に、まず彼らの知識を確認したいと思うでしょう。

新入社員が新しいキャリアを最良のスタートで始められるように、基本的な情報で彼らの知識をブートストラップすることをお勧めします。基本的なデータガバナンスのベストプラクティスに投資していれば、彼らは飛躍的なスタートを切ることができます。ここでUnity Catalogが助けてくれます。テーブルやカラムに有用なコメントを作成しておき、Genieに提供したいテーブル間で主キー/外部キーの関係を作成する時間を取ることを確認してください。この基本情報により、Genieは初日から多くの基本知識を持つことができます!

次のステップは、日常的にチームが尋ねるであろういくつかのことをGenieに尋ねることです。

この最初の例では、Genieは簡単に質問に正解します。

カタログエクスプローラー(上)でテーブルのメタデータを見ると、列のコメントがGenieに正しい答えを出すための十分な情報を提供していることがわかります。やった!

この2つ目の例では、Genieは平均価格の列名から推測される最も明白な定義が間違っているため、間違った推測をしました。

私たちが基礎となるSQLを見ると、Genieが価格のための間違った列を選んだことがわかります。GenieはUnitPriceではなく、ListPrice列を選択するべきでした。

これは、カタログエクスプローラーで目的の列に有用な説明コメントを付けることで解決できます:

この更新により、Genieは正しい答えを出すようになります。

上では、ユーザーがGenieに前と全く同じ質問をしたことがわかります。

上記から、Genieがクエリで正しい列ListPriceを使用していることがわかります。

次に、Genieが推測しようともしない例をもう一つ挙げます。それは、特定のチーム固有の指標がどのように定義されているかという重要な文脈が欠けているからです。この文脈がなければ、Genieは正しい答えを推測する方法がありません。

それでは、この指標をGenieに教えましょう!私たちは単にメトリックをGenieに直接提供し、何が起こるかを見ることができます。

UIで直接顧客の離脱の定義をGenieに伝え、プロンプトを実行します。

上記から、Genieがプロンプトを理解し、データを正しくクエリできることがわかります。

今、Genieがこの新しい指標を正しく計算する方法を学んだことを確認したので、"指示として追加"をクリックすることで、これを今後話す全ての人に対して覚えておくように指示することができます。

これにより、指示がInstructionsセクションに保存され、Genieが仕事をする際に考慮すべきすべての事項が保存されます。これは「Example SQL Queries」で見つけることができますが、指示のいずれかを手動で更新することもできます。

あなたのGenieスペースを公開する前に、ユーザーが使用するであろう既知/予想される質問やビジネスセマンティクスに対して、可能な限り多くのこの種の指示を追加することをお勧めします。これは、チャットしながら指示を保存するか、スペースの指示セクションに直接追加することで行うことができます。あなたがGenieを訓練するほど、Genieは賢くなります!

チームが質問すると予想される質問に対して有用で正確な答えを提供していることに自信を持つまでGenieをテストしたら、チームメンバーが新入社員のGenieと話す時間です。

"シェア"を押して、Genieに話しかけることができる人を教えてください。Genieが誰のために質問に答えるべきかによって、個々の人々を選ぶことも、あなたの全チームを代表するグループを選ぶことも、または全社を選ぶこともできます。

また、Genieに何を期待するかについてもチームに伝えるべきです。彼らはおそらく、これまでにこんなロボットのチームメイトと一緒に働いたことがないでしょう。彼らはおそらくSQLを話すことができないので、Genieが実際に正しい答えを出しているのか、それとも本当に間違っているのに良い推測をしているのかを判断する方法がないかもしれません。Genieが正確に答えると予想される質問についてチームに伝えることができますし、一般的には、彼らが重要な質問を持っているがGenieが正確に答えているかどうかわからない場合、それを使用する前にあなたに確認するべきです。

仕事に取り掛かる

それでは、新しいGenieのチームメイトをチームに解き放ったところで、チームのメンバーがそれとどのようにやり取りするか見てみましょう。

Genieのテストで行ったように、チームの誰もが質問を始めて回答を得ることができます。

あなたのユーザーは、Genieの応答を見た後、サムズアップ/サムズダウンボタンをクリックしてフィードバックを提供することができます。これらの投票はMonitoringセクションに表示され、ユーザーがどのような質問をしているか、Genieに教える新しいことを特定することができます。

ここでは、質問されたすべての質問と、チームからの「いいね/いいねしない」フィードバックを見ることができます。

最も興味深いのは、あなたが以前に予想していなかった質問で、Genieが正しく答えるかどうかまだ確信が持てない場合かもしれません。各質問について、Genieがどのように答えたかを見て、それが正しかったかどうかを確認することができます。もし正しくなかった場合、それは自分自身でチャットセッションに参加し、Genieに正しい答えを教える機会かもしれません。

また、「いいねしない」のインタラクションをフィルタリングすることもできます。なぜなら、よくあるのは2つの事柄のうちの1つだからです。まず、Genieは間違った答えを出したかもしれませんので、Genieに知らないことを教える必要があります。まず二つ目、あなたはGenieが正しく答えていると思うかもしれませんが、Genieと話しているチームメイトはあなたとは異なる前提を持っている可能性があり、その結果、Genieが正しく、または有用に答えていないと結論づけるかもしれません。これらの仮定の違いを明確にすると役立ちます。

Genieについてもっと学びましょう

Genieの目標の多くは、どのチームの誰でもが、より技術的なチームメンバーを過度に負担させたり、その質問に答えるのを待つことなく、彼らが探している洞察を得ることができるようにすることです。これらの例が役立ったことを願っていますし、Genieを試してみてほしいと思っています。Genieについて深く探るためには、DatabricksのGenieに関するドキュメンテーション、特に私たちがまとめたベストプラクティスをチェックしてみてください。フィードバックがあればお知らせください。Genieとの経験を学ぶことを楽しみにしています!

Databricks 無料トライアル

関連記事

AI/BIの発表:リアルデータに基づくインテリジェント解析の時代へ!

Translation Review by saki.kitaoka 本日、私たちは Databricks AI/BI の発表を大変楽しみにしています。これは、データの意味を深く理解し、誰でもデータを自ら分析できるように設計された新しいビジネスインテリジェンス製品です。AI/BIは、ETLパイプライン、系統、その他のクエリなど、Databricksプラットフォーム全体のデータのライフサイクルからインサイトを引き出す 複合AIシステム に基づいて構築されています。このAI/BIは、次の2つの補完的な製品体験を提供します。 AI/BIダッシュボード: AI駆動のローコードダッシュボードソリューションで、従来のBI機能をすべて備えており、固定されたビジネス質問に答えるために設計されています。 Genie: 人間のフィードバックに基づいてデータとその意味を継続的に学習し、より広範なビジネス質問に答えることができる会話型インターフェースです。データチームによって指定されたクエリパターンについては、確認済みの回答も提供します

マテリアライズド・ビューによるLakeviewダッシュボードの高速化

このブログ記事では、Databricks SQL マテリアライズド・ビュー をLakeviewダッシュボードで使用して、ビジネスに新鮮なデータと洞察を提供する方法を紹介します。 先日、 Databricks Data Intelligence Platform におけるLakeviewダッシュボードのパブリックプレビューを 発表 しました。Lakeview のダッシュボードは、Databricksの顧客のためのビジュアライゼーションとレポーティング体験の作成において、大きな前進を意味します。 視覚化が大幅に改善され、共有や配布に最適化されたシンプルなデザイン体験を提供します。 Lakeview ダッシュボードは Databricks SQL (DBSQL) データウェアハウス上で実行されます。 DBSQLを使用すると、レガシーなクラウドデータウェアハウスの数分の一のコストで、選択したツールですべてのSQLおよびBIアプリケーションを大規模に実行できます。 マテリアライズド・ビューは、ビジネスに新鮮なデータを提供す

スーパーノヴァ!ブラックホール!ストリーミングデータ!

Translation Reviewed by Akihiro.Kuwano 概要 このブログ投稿は、Data + AI Summit 2024でのセッション スーパーノヴァからLLMsへ のフォローアップで、ここでは誰でもApache Kafkaから公開されているNASAの衛星データを消費し、処理する方法を示しました。 多くのKafkaのデモとは異なり、再現性が低いか、シミュレートされたデータに依存しているのではなく、私はNASAの公開されている ガンマ線座標ネットワーク (GCN)からのライブデータストリームの分析方法を示します。これは、さまざまな衛星から来るスーパーノヴァとブラックホールのデータを統合しています。 オープンソースの Apache Spark™ と Apache Kafka だけを使ってソリューションを作ることも可能ですが、このタスクには...
プラットフォームブログ一覧へ