メインコンテンツへジャンプ

私たちは、Databricks for GamesとGameAnalyticsとの共同の取り組みを発表できることを嬉しく思います。このブログと関連コードは、両社の顧客がGameAnalyticsからのデータをDatabricks Lakehouseに取り込むのに役立ちます。これにより、GameAnalytics、内部システム、および他の第三者データプロバイダからのデータを活用して、追加の分析、機械学習、およびデータ統合を実行することができます。このデータ統合は、プレイヤー、ゲーム、マーケティング努力、事実上ビジネスのあらゆる側面を完全に理解するために重要です。

ご存知ない方のために説明すると、GameAnalyticsは、モバイル、Roblox、PC、VRゲームの分析と市場情報のトッププロバイダーであり、プレイヤーの行動と外部市場の動向に深い洞察を提供する強力なツールを提供しています。13年以上の業界経験を持つ彼らのデータ駆動型ツールは、開発者が獲得、収益化、エンゲージメント戦略を最適化するのに役立っています。リアルタイム分析やパフォーマンスレポートからLiveOps機能、市場洞察まで、GameAnalyticsは開発の各段階をサポートします - あなたがビルドしているか、視聴者を増やしているか、あるいはポートフォリオを大規模に最適化しているかに関わらず。

このソリューションでは、Databricks on AWSを使用している顧客のためにS3に届くすべてのデータソースに対応するパターンから始めます。次に、Delta Live Tables(DLT)を処理エンジンとして活用します。これには、データの取り込み、変換、品質検証を通じて私たちの作業を容易にする機能が含まれています。データ ペイロードは JSON パッケージであり、一連のテーブルに展開して分割します。そこから、DLT内のデータ品質チェック機能を活用して、データからの基準と期待を強制します。最後に、このデータをプラットフォーム内で有効に活用するいくつかの方法を示します。

このソリューションは、私たちのAWSゲームバックエンドフレームワークPlayFabの同様のリリースを補完するものです。もし、私たちが統合すべきと思う重要なゲーム特有のデータプロバイダーがあれば、アカウントチームを通じてお知らせください。お客様、お客様のチーム、そしてお客様のパートナーとさらに協力したいと考えています。

GameAnalyticsからDatabricksへのデータ取得

まず、GameAnalyticsデータエクスポートノートブックを使用して始めます。このノートブックでは、クラウドストレージにアクセスできるようにストレージ認証情報を作成します。次に、Unity Catalogに外部ロケーションを作成し、最終的にはユーザーにアクセス権を付与します。これが完了すると、データアプリケーションは簡単にDatabricks環境での読み書きができるようになります。

DLT UIにおけるスケジューリング。開発モードでは、より良いインタラクティブ体験を提供するためにクラスタを維持します。完了したら、プロダクションボタンをクリックしてパイプラインをプロダクションに移行し、必要に応じてクラスタを起動し、不要なときにはクラスタを停止します。本番環境に移行するための第二のステップはスケジュールを設定することです。S3リスナーを介してこのパイプラインをスケジュールすることも可能ですが、バッチ処理であり、15分ごとに到着するため、それは過剰です。代わりに、最新のデータを取得するために、その間隔でcronを使用してスケジュールします。Databricksはスケジューリングを非常に簡単にします、以下のスクリーンショットをご覧ください。

データの分割

データの保存場所ができたので、DLTを活用してデータセットのためのメダリオンアーキテクチャを作成します。メダリオンアーキテクチャに馴染みがない方のために説明すると、メダリオンアーキテクチャは、段階的にブロンズ(生データ)からシルバー(クリーニングされ、適合)へ、ゴールド(キュレーションされたビジネスレベルのデータセット)へと進み、データ取り込みパイプラインの一般的なベストプラクティスとなっています。このアーキテクチャを活用することで、データ品質の向上、パイプラインのスケーラビリティ、およびクエリパフォーマンスを確保できます。メダリオンアーキテクチャについて詳しく知るには、こちらをご覧ください

プロセスは、監査、デバッグ、再処理が必要な場合に備えて、変換なしでS3からデータをロードすることから始まります。このレイヤーには、タイムスタンプ、元のファイルパス、ファイル名などの追加メタデータを付加して、データエンジニアリングがデータの源を追跡し、問題をトラブルシューティングし、後続のステージで効率的に処理できるようにします。ノートブックは、このメタデータをどのように追加し、ここで提案するスキーマを示しています。特に注目すべきは、Databricksにデータをロードするのがどれほど簡単かです。DLTと私たちのAuto-loader機能を活用することで、コードは非常に直感的です。

GameAnalyticsは、パイプラインに翻訳する必要がある各イベントタイプのスキーマを提供します。これらのリソースを使用してデータの取り込みを検証することで、データ取り込みプロセス中にスキーマを強制し、データの一貫性を確認し、データ品質を確認し、データパイプラインの早い段階で問題を解決することができます。最終的に、標準化されたデータ形式を強制することで、データガバナンスとコンプライアンス要件をより効果的に満たすことができます。

データ品質の強制

すべてのデータをBronzeに取り込んだので、次にSilverレイヤーを構築します。これはノートブック内のコードの大部分で、スキーマを定義し、テーブル内のフィールドのメタデータを追加し、JSONをテーブルに変換します。これで、マシンラーニングの取り組み、GenAI、または特定のチーム、ビジネス要件、レポートをサポートするためのゴールドレイヤーを作成するために使用できるデータセットが手に入りました。これらのデータセットがDatabricksにあるので、使用している可視化ツールやAI/BIダッシュボードに簡単に接続できます。また、Databricksの高度な機能、例えばAutoML、AI/BI Genie Spacesを活用することもできます。あなたのチームは、洞察を生み出すためのドライバーシートに座り、GameAnalyticsのような最高品質のツールでも組み込まれていない可能性のある、あなたの会社にとってユニークなリンクを発見することができます。

このアクセラレータの目的上、ゴールド テーブルまではまだ取り上げていません。ゴールド テーブルは一般に組織に固有のものであり、事業部門で構築するものだからです。今後、我々はこのソリューションアクセラレータが特定のユースケースとチーム要件をどのように対処できるかを示すように進化させます。このブログの残りの部分では、Silverにとどまらず、Databricksを活用してGameAnalyticsデータセットから洞察と価値を引き出す方法を示します。GameAnalyticsは、我々が一連のユースケースで我々のシルバーテーブルを視覚化するために使用できるダミーデータセットを提供してくれました。データは生成されるので、出力は参考用であり、実際のものではないことに注意してください。

使用例:キャンペーンの影響

広告によってサポートされるゲームのケースを考えてみましょう。このLakeviewの視覚化では、マーケティングキャンペーンによって分けられたタイトルの広告インプレッション数を時間経過で見ることができます。生成されたデータセットとして、我々はすべてのキャンペーンにわたって非常に一貫したビューを見ることができます。健全な成長曲線を見ていますが、突然の落ち込みがあります。しかし、これらのキャンペーンのどれが他のキャンペーンよりも財務的に優れているかを実際には判断することはできません。

データセット自体を持っているので、我々は「どのキャンペーンが最も影響力があるか」という問いに答えるための異なる視覚化を簡単に作成することができますが、その場合でなければ、我々は高パフォーマンスのユーザーと低パフォーマンスのユーザーを引き寄せるキャンペーンを探し、ゲームのインストールにつながったキャンペーンとソースについて反省します。これにより、広告費の影響を理解し、将来のユーザー獲得(UA)の努力のための支出を再調整することができます。

上記のビジュアライゼーションは、ゲーム全体のパフォーマンスを理解するのには素晴らしいですが、特定のキャンペーンやそのコホートのパフォーマンスを理解するのにはあまり役立ちません。このケースでは、同じデータセットを使用して視覚化を簡単に変更できるLakeviewの利点を活用し、代わりにこの棒グラフを作成しました。

ここから、AI/BI Genieスペースを活用して、ここで見たものの背後にある理由をより深く理解することができます。なぜキャンペーン1、2、6は成績が悪かったのでしょうか?特定の広告プロバイダーを通じて行われたのか、異なるクリエイティブを使用したのか、その同じ時期にリリースがあったのか。このようなデータのQ&Aは、Genie Spacesを使用すると簡単に行うことができます。

GameAnalyticsは、2つのゲームが完全に同じではないため、カスタムフィールドを作成する機会を提供します。このデータセットでは、プレイヤーのキャラクタータイプ(アーチャー、メイジ、ウォリアー)がカスタムフィールドの一つです。キャンペーンと選ばれたキャラクタータイプに関連するパターンが見つかるかどうか興味がありました。キャンペーンのクリエイティブやタイミングが特定のアーキタイプにより響いたのでしょうか?最初のステップとして、インストールキャンペーンごとの収益を取り、キャラクターフィールドによる内訳を示すピボットテーブルを作成しました。

私たちはキャンペーン1、2、6を低パフォーマンスとして特定しました。この視点から見ると、キャンペーン1は高価値のメイジをもたらしましたが、5ほど高価値ではありませんでした。また、キャンペーン2は全体的に不調だったので、何が違ったのかを見て、再びそれを避けるようにしましょう。最後に、キャンペーン6では、2番目に高い収益を上げたアーチャーグループを取り入れました:このキャンペーンと#8で共通していたことは何でしょうか?次回、アーチャーに重点を置いたコンテンツドロップを行う際に活用できる可能性があります。

新しいデータセットとの会話を持つ

このデータがDatabricksにあるため、プラットフォームのすべての機能が利用可能になります。これには、高度な機械学習、統計分析、その他のデータアプリケーションが含まれます。プラットフォームを進化させ続ける中で、私たちの焦点は洞察力の生成をビジネスオーナーの手に委ねることです。データチームを排除するつもりはありませんが、データチームとビジネスパートナーとの対話を助けたいと考えています。また、データチームの低価値で繰り返しのタスクを最小限に抑えることを望んでいます。

私たちが進化している一つの方法は、AI/BIの能力を通じてです。AI/BI Genieスペースについての私たちのブログをまだ読んでいない場合は、こちらをチェックしてください。GameAnalyticsは、ビジネス全体で役立つ多種多様なデータポイントを提供します。事前に、どのダッシュボード、どのKPI、どの結合、ビジネスチームがどのような質問をするかを知ることは現実的ではありません。AI/BIを活用することで、GameAnalyticsが提供するデータポイントと他の関連するファーストパーティのデータセットにチャットインターフェースを作成することができます。このセクションでは、そうする価値をさらに探求します。GameAnalyticsから得たものを使ってジニー空間を作成しましょう。

AI/BI Genie Spaceを作成し、ビジネスチームに渡し、「これでデータに質問できます!おめでとうございます」と言いました。(そうしないでください!)ビジネスチームはビジネスの文脈、潜在的なデータを理解していますが、このスペースに何があるのか、または各列が何を意味するのかを必ずしも知っているわけではありません。したがって、彼らはこのスペースのデータをGenieに説明してもらうことから始めます。

広告、収益化、進行状況、ユーザーセッションの詳細に関する情報があることがわかります。データセット全体を理解するビジネスリーダーにとって、これはすべて理にかなっています。彼らは役割の文脈で興味深い質問をすることができます。しかし、これは常に当てはまるわけではなく、AI/BIがどのように洞察を引き出すのかを示す別の例を提供してくれます。例えば、「これらのデータセットにどのような質問をすることができますか」という質問を部屋に投げかけます。

モデルはデータを見て、自分で非常に役立つ質問をいくつか考え出します。スペースを作成する際には、ユーザーが正しいマインドセットに入るのを助けるために自分の質問を追加することができます。

これは魔法ではありません、反復により結果が改善します

提案された質問に基づいて、広告ネットワーク別の収益を掘り下げることにしました。最も収益を生み出している広告ネットワークを表示するようにシステムに依頼すると、答えは得られますが、(null)ネットワークを除外すると明らかに何かが間違っています。エンドユーザーはデータチームに戻って助けを求めるでしょう。そのチームは会話の履歴を見て、目指す結果を推測し、何が起こっているのかをデバッグするのに役立ちます。これは、ツールが生成されたコードを表示するためのドロップダウンを持っている理由を示しています。

ここでは、total_revenueが‘publisher_revenue’から集計されていることがわかります。その列を見ると、この列には通貨の種類が記載されており、生成された収益の額は記載されていません。正しい列は `publisher_revenue_usd_cents` です。AI/BI Genieのスペースはブラックボックスではないので、サンプルの質問やクエリを追加して、Genieの今後の情報提供に役立てることができます。

この質問と修正されたクエリをスペースに追加したので、問題が解決したことを確認できます。「私がこの具体的な質問をしたら、このように答える」というよりも、スペースがデータをより理解するのに役立つ入力を提供したことを示すために、少し異なる質問をします。「広告ネットワーク別の収益を表示してください。」このクエリでは、収益が `publisher_revenue_usd_cents` 列を参照することを期待します。そして、それが参照されていることがわかります。

まとめ

このソリューションアクセラレータでは次のことを示します:

  • GameAnalyticsからデータを取り出してDatabricksに入れる方法
  • 他のデータソースでも同じことを行うための反復可能なアプローチ
  • 洞察力の生成に使用できるデータプラットフォームにコアデータを持つ価値
  • Databricksのさまざまな機能、例えばLakeviewダッシュボードやAI/BI Genieスペースが、あなたのインサイト発見プロセスの一部となる方法についてのアイデア

GameAnalyticsのような素晴らしいパートナーと働く機会を得られることを特権と感じており、コミュニティがプレイヤーに楽しみをもたらすのを支援できることを嬉しく思います。明らかにこれはステップワンであり、単一のデータソースです。このデータソースだけであれば、この場合はGameAnalyticsと協力して、プラットフォームに組み込まれていない必要な視覚化と洞察を追加することができます。このデータ、他の第三者サービスからのデータ、およびあなたの第一者が生成したデータをあなたのデータプラットフォームに取り込むことで、組織にとっての価値を大幅に引き上げます。

このソリューションアクセラレータのコードはこちらで見つけることができます。GameAnalyticsとの接続や摂取サポート、または彼らのデータエクスポートソリューションについて詳しく知りたい場合は、[email protected]までお問い合わせください。このコネクタの背後にいるチームと話をしたい、アプローチについて話をしたい、または解決しようとしているデータの課題について話をしたい場合は、Databricksのアカウントチームにお問い合わせください。私たちはここで助けるためにいます。

ゲームデータ+AIの使用例をもっと知りたいですか?

ゲームデータとAIの究極ガイドをダウンロードしてください。この包括的な電子書籍では、ゲームデータとAIに関する主要なトピック、ビジネス価値から実装のためのコアユースケースまで、詳細に探求します。あなたが経験豊富なデータベテランであろうと、まだ始まったばかりであろうと、我々のガイドはあなたがゲーム開発を次のレベルに引き上げるために必要な知識を装備させます。

Databricks 無料トライアル

関連記事

ゲーム業界向け『AI パワード BI』のご紹介

September 24, 2024 Huntting Buckleyダンカン・デイビス による投稿 in
「よくダッシュボードの作成を依頼されるのですが、依頼内容がはっきりしていないことが多く、たとえ依頼者と会話をしても完全に理解できない場合があります。そのため、こちらで何かを作成しても、期待に合わずに最初からやり直したり、修正を重ねる必要が出てくることがあります。ここで興味深いのは、1) 依頼者自身で解答を見つけられる可能性があること、そして2) さらに重要かもしれないのは、依頼者が自分の探しているものに近いものを見つけることで、それを元に私たちのチームへの依頼内容を具体化できるという点です。」 - AAAスタジオのデータリーダー はじめに 2023年11月にDatabricksの次の進化「The Data Intelligence Platform」を発表した際、機械学習や生成AI(GenAI)などの機能をプラットフォームに統合する計画を共有しました。これにより、皆さんの生産性を向上させ、データから生み出せる価値をさらに高めることができます。本ブログでは、データインサイトの生成を民主化することを目指した機能の一つ

ゲームのためのLLMアシストセグメンテーション

September 6, 2024 ダンカン・デイビスHuntting Buckley による投稿 in
セグメンテーションプロジェクトは、ゲームにおけるパーソナライゼーションの土台です。プレイヤー体験のパーソナライゼーションは、プレイヤーのエンゲージメントを最大化し、離脱を緩和し、プレイヤーの支出を増加させるのに役立ちます。パーソナライゼーションのメカニズムは、ネクストベストオファー、ゲーム内ストアの注文、難易度設定、マッチメイキング、サインポスト、マーケティング、再エンゲージメントなど、さまざまな形で存在します。理想的には、各プレイヤーの経験がユニークであることが望ましいですが、これは実現可能ではありません。代わりに、私たちはプレイヤーを一連のデータポイントでグループ化し、そのグループの体験をパーソナライズします。 このソリューションアクセラレータでは、まずLLMを活用して、特定のデータセットに対する適切なクラスタ数を決定します。まず、標準的で説明可能な機械学習技術、例えばK-meansクラスタリングを使用します。説明可能性は重要であり、クラスターへの信頼を築き、特定のプレイヤーに対してなぜその決定が下されたのか

大規模なプレイヤーフィードバックを管理し、理解しよう

ライブタイトル、本番運用前/運用後、進行中のメンテナンス、将来のリリース、ゲームの別バージョン、または市場向けのまったく新しいタイトルのいずれに取り組んでいる場合でも、常にコミュニティからのフィードバックを求めています。 世の中には不足はありませんが、圧倒され、ふるいにかけるのが難しい場合があります。 PC で出荷され、Valve の Steam ストアを通じて販売されるゲームの場合、タイトルに対するプレイヤーからのフィードバックの優れたソースは、Steam のゲームレビューで見つけることができます。 私たちは 、自然言語と機械学習技術 を組み合わせた、プレイヤーレビュー分析用の新しいソリューションアクセラレータを構築しました。これにより、ゲーム開発者はプレイヤーをより深く理解し、ゲームデザイン、バックエンドオペレーション、ライブオペレーション、マーケティング、そして実際にはすべての事業ラインを通じて対応できるようになります。 Steamのゲームレビューでは、次のことを見ることができます。 生のフィードバック:
業界一覧へ