「よくダッシュボードの作成を依頼されるのですが、依頼内容がはっきりしていないことが多く、たとえ依頼者と会話をしても完全に理解できない場合があります。そのため、こちらで何かを作成しても、期待に合わずに最初からやり直したり、修正を重ねる必要が出てくることがあります。ここで興味深いのは、1) 依頼者自身で解答を見つけられる可能性があること、そして2) さらに重要かもしれないのは、依頼者が自分の探しているものに近いものを見つけることで、それを元に私たちのチームへの依頼内容を具体化できるという点です。」- AAAスタジオのデータリーダー
はじめに
2023年11月にDatabricksの次の進化「The Data Intelligence Platform」を発表した際、機械学習や生成AI(GenAI)などの機能をプラットフォームに統合する計画を共有しました。これにより、皆さんの生産性を向上させ、データから生み出せる価値をさらに高めることができます。本ブログでは、データインサイトの生成を民主化することを目指した機能の一つ「AI/BI Genie」について紹介します。
Genieスペースは、データに対するチャットインターフェースを作成し、ユーザーがデータと直接対話し、探索できる機能を提供します。ダッシュボードが表示する内容に限られることなく、ユーザーは自分の質問を投げかけ、詳細を深く掘り下げることができます。指定された一連のテーブルに対して、ユーザーがデータに関する質問を行うと、スペースが質問を解釈し、その結果を提示します。このスペースを使うことで、ユーザーはまるでデータアナリストと隣り合わせで作業しているかのように、自分のアイデアを探索できます。さらに、結果を視覚化することも可能です。Genieスペースの詳細な説明については、こちらのドキュメンテーションをご覧ください。
続いて、公開されているWorld of Warcraft (WoW) のデータセットを用いてGenieスペースを作成し、ユーザージャーニーを再現し、ゲーム企業にどのような価値をもたらすかを探っていきます。Genieスペースのセットアップがいかに簡単かを理解いただければ、自分のデータセットを使って試してみたくなるでしょう。Unity Catalogが有効化されていれば、サンプルスペースよりも簡単にセットアップが可能です。
Genieスペースの作成
これを実行するためには、Unity Catalogにいる必要があるか、UCで使用するデータセットを持っている必要があります。この記事を書いている時点では、Genie spacesはまだパブリックプレビュー中なので、最初のステップはワークスペースレベルから有効にすることです。プレビューページ。有効にすると、Databricksワークスペースの左側に「Genie」が表示されます。そこをクリックしてから右上の「新規」を選択し、タイトルを付け、倉庫を割り当て、テーブルを追加します。
Genieスペースを作成し、含めるテーブルを選択する際には、エンドユーザーを考えてください。誰が質問をするのでしょうか?彼らはどのような質問をするつもりですか?どのテーブルがその質問をサポートする可能性がありますか?あなたは、対象となるドメインのためにシルバーおよび/またはゴールドテーブルを含めることができます。明らかに、全く関連性のないデータセットを避けてください。それはあなたの結果にネガティブな影響を与えます。
このブログでは、3年間にわたるWoWのキャラクターに関する情報を含むkaggleデータセットを使用しています。データセットには、高レベルのセッション情報、キャラクターレベルの進行、キャラクタークラス、セッション中に入ったゾーン、ギルド メンバーシップなどの関連詳細が含まれています。このジニー空間を探索する際、新たにこの機能を利用するゲームデザイナーの視点で、オープンワールド全体でのキャラクターのエンゲージメントを理解しようと考えました。
Genieスペースの始め方
スペースに入ると、データセットを分析して、このスペースに含まれるデータで回答できるいくつかの質問例を提供してくれるボタンがあります。デフォルトでは、これらの質問例は含まれているデータセットに基づいてGenieスペースが自動生成しますが、スペース作成時に自分で例を追加することも可能です。これらのプロンプトは、新しいユーザーがこのスペースでどのようなことができるのかを理解し、使い始める手助けをします。さらに、ユーザーは次の図で示すように、スペースに対してアクセス可能なデータの説明を求めることもできます。これにより、テーブルやそのカラム、内容の意味についての詳細が生成されます。
データの問い合わせと反復
このGenieスペースでは、過去3年間のWoWホードキャラクターデータを収集したKaggleデータセットを使用しています。このデータセットのテーブルは互いにうまく関連付けられており、すべてのテーブルをインポートしました。その後、このGenieスペースを新しい機能としてゲームデザイナーがゲーム内のキャラクター体験について学ぶ視点で試してみました。
まずは、上記のようにスペースに対してテーブルの概要を説明してもらいました。すると、キャラクターのレベル、さまざまなマップゾーン、セッション情報、レベル、種 族、クラス、特定の時間にいたゾーンなど、ゲーム内のキャラクターに関する情報があることがわかりました。また、ゲーム内のキャラクターを表す「char」カラムと「sessionID」がこれらのテーブル全体のコアなプライマリキーであることも教えてくれました。
インターフェースに慣れるために、まず簡単な質問から始めました。「プレイヤーが最初に選ぶことが多い種族は何ですか?」と尋ねたところ、返ってきた回答は、求めていたものとは少し異なっていました。なぜでしょうか?それは、このテーブルにはプレイヤーIDがなく、キャラクターIDしかないからです。スペースは、最も多くのキャラクター数に基づいて、最も一般的に選ばれる種族を返してくれました。
この例からいくつか重要な点が見えてきます。
- モデルは、質問があまりうまく書かれていなくても処理できます。「most commonly race」と「what is the most commonly picked race...」といった違いでも対応可能です。
- モデルは、質問に対してそれらしい答えを見つけようとします。つまり、キャラクターとプレイヤーの違いに関わらず、それに近いものを返してくれるということです。これは良い点でもあり、悪い点でもあります。モデルは、必ずしも正確な答えが返されていないことに気づかないので、注意深く見る必要があります。
- モデルは回答を提供するだけでなく、返された結果に対する説明も行ってくれます。これが上記の2番目のポイントの補助となります。「このクエリは、最も多くのキャラクター数を持つ種族を取得します...」という説明には、実際には「プレイヤー」とは書かれていないことに気づくでしょう。
例えば、ブラッドエルフが最も多く作成されたキャラクターであるからといって、プレイヤーが実際にそれを使用しているわけではないかもしれません。キャラクター数やプレイ時間ごとの種族のランクリストを求めることも考えられますが、今回はさらに深掘りして、ブラッドエルフのエンゲージメントを探るために、「ブラッドエルフのレベル分布はどうなっていますか?」と質問しました。
このテーブルは有用で、数字が得意な人なら、レベル1からレベル10に移ると数字が急速に減少していることがすぐにわかります。このタイプの分析では、視覚化が消費しやすいかもしれません。スペースに質問をした後、"visualize"というボタンが表示されます。ここでそれを行うと、このチャートが提供されます。
これは非常に役立ちます。ブラッドエルフを作成するプレイヤーが多い一方で、レベルを上げていないことがすぐにわかります。もしプレイヤーデータがあれば、この情報を基に考え方を変える必要があるかもしれません。例えば、各プレイヤーごとにプレイ時間に基づくトップキャラクタークラスを表示してもらい、特定のクラスに対する嗜好があるかどうかを確認することもできます。今回はプレイヤーデータがないため、この視覚化にさらに深く掘り下げてみます。
レベル55、58、70、80のところにピークが見られます。これは、ゲームデザイナーならすぐにわかるように、新しいリリースによるレベルキャップの変更が原因 です。このインサイトを基に、再エンゲージメントのメールキャンペーンを立ち上げることができるでしょう。「CHAR_NAMEのCHAR_CLASSには、まだたくさんの冒険が待っています。新しいレベルキャップ80に向けて、新たな冒険を体験しましょう。あと(LEVEL_CAP - CURR_LEVEL)レベルです。この旅をサポートするために、FREE_NEW_CONTENTを差し上げます。EVENT_TARGET_DATEまでにLEVEL_CAPに到達すると、HIGH_TIER_CONTENTが手に入ります。」
まとめ
これは、Genieスペースがゲームデザイナーにどのようにデータを探索し、インサイトを見つけ、それに基づいて行動する手助けをするかの短い例です。この例を通じて、皆さんも自身のデータセットで試してみたいと感じていただければ幸いです。今回の例はプレイヤーエンゲージメントデータに焦点を当てましたが、同じプロセスと機能は、マーケティング、キャンペーンの最適化、サーバー運用、試合結果、LiveOperationsなど、すべてのゲームドメインに適用することができます。
冒頭では、あるスタジオからのコメントを紹介しましたが、ここではAAコンソールゲームメーカーとモバイルスタジオからのコメントも紹介します。
- 「受けるリクエストの多くはアドホックで、『この数値を見つけてくれ』というものです。こうしたリクエストは結果的に反復的な作業になることが多く、数値を提示すると、その背景を知りたいと言われます。このツールを見ていて思ったのは、質問に関連するデータでGenieスペースを作り、彼ら自身が答えを見つけ、その詳細を確認する力を持てるようにできるということです。これにより、チームの時間を節約できるだけでなく、エンドユーザーを満足させることができるでしょう。」 - AAコンソールゲームメーカーのデータアナリティクスディレクター
- 「私のエンドユーザーの中には、集めているデータを非常によく理解している人もおり、多少のSQLを知っている人もいますが、エキスパートではありません。大半は製品マネージャー、ゲームデザイナー、LiveOpsチームであり、彼らはデータへのアクセスを増やし、自分で答えを見つける能力を求めています。この機能を使えば、彼らのドメインに特化したスペースを作り、自己サービスツールを提供することで、変化への対応速度を速め、チームの手をより大きなプロジェクトに使えるようにできます。」 - モバイルゲームのデータオペレーションディレクター
AI/BI Genieスペースを使うことで、チームがデータと会話しながらインサイトを得られるようになり、内部顧客の満足度を高めるだけでなく、データチームが高付加価値なプロジェクトに取り組む余裕も生まれます。この投稿では、Genieスペースの作成がどれだけ簡単かを示しました。ぜひ、自身のデータセットでGenieスペースを作成し、プレイヤーについて新しい発見をしてみてください。
Genieスペースについて詳しく学びたい、それらを有効にする方法や使い方を知りたい場合は、公式ドキュメンテーションをご覧いただくか、Databricksのアカウントチームにお問い合わせください。追加のゲームデータやAIの使用例については、他のソリューションアクセラレータやゲームデータとAIのガイドをご覧ください。