ゲームのためのLLMアシストセグメンテーション

公開日: September 6, 2024

セグメンテーションプロジェクトは、ゲームにおけるパーソナライゼーションの土台です。プレイヤー体験のパーソナライゼーションは、プレイヤーのエンゲージメントを最大化し、離脱を緩和し、プレイヤーの支出を増加させるのに役立ちます。パーソナライゼーションのメカニズムは、ネクストベストオファー、ゲーム内ストアの注文、難易度設定、マッチメイキング、サインポスト、マーケティング、再エンゲージメントなど、さまざまな形で存在します。理想的には、各プレイヤーの経験がユニークであることが望ましいですが、これは実現可能ではありません。代わりに、私たちはプレイヤーを一連のデータポイントでグループ化し、そのグループの体験をパーソナライズします。

このソリューションアクセラレータでは、まずLLMを活用して、特定のデータセットに対する適切なクラスタ数を決定します。まず、標準的で説明可能な機械学習技術、例えばK-meansクラスタリングを使用します。説明可能性は重要であり、クラスターへの信頼を築き、特定のプレイヤーに対してなぜその決定が下されたのかを理解することができます。クラスタが作成されたら、LLMを活用してそれらを説明し、関心のある当事者がそれらを利用できるようにします。

ヒューリスティックス対MLベースのセグメンテーション

基本的なヒューリスティックベースのセグメンテーションは直感的です。多くのゲーム会社がこれを行い、一日を終えるでしょう。ペイヤー対非ペイヤー、最近2週間以内にログインしたかどうか、PVP対PVEなどは計算し、伝え、利用するのは簡単ですが、それだけでは表面をかすめているだけです。パーソナライゼーションプロジェクトが効果的に機能するためには、より深い洞察が必要です。プレイヤーグループの行動、プレイスタイル、ソーシャルエンゲージメント、ゲーム内のコンテンツとの相互作用を理解することは、彼らのプレイ体験を最大化するために必要な洞察を提供します。

非ヒューリスティックなセグメンテーションプロジェクトは困難で、遅く、時間がかかります。データポイントのセットにクラスタリングを行うことは難しくありません。しかし、それらのクラスターを理解し、それらが何を教えてくれるのか、どのように使用するのかは、難しい人間中心の問題です。我々は、チームがセグメンテーションの努力に数週間を費やし、最終的にそれをキャンセルしたり、6ヶ月かけてクラスターがもはや意味をなさないことを発見することを経験しています。これらの結果は、分析者が生成されたクラスタが何によってユニークであるかを決定しなければならないために発生します。その後、クラスターが何を意味し、いつそれを使用するべきかを説明する必要があります。これを効果的に行うためには、クラスターの数を小さく保つ（3-4）必要があります。なぜなら、より大きなセグメントセット間の違いを見つけることはしばしば微妙だからです。これは過学習を引き起こし、異なる人々をグループ化し、あなたのパーソナライゼーションの努力を台無しにする可能性があります。

セグメンテーションプロジェクトにおける反復の重要性

さらに複雑なことに、新しいゲームコンテンツ、新しい視聴者の参加、経済に対する変更、視聴者の欲求の変化、またはゲームが安定した状態に達する結果として、クラスタの構成は時間とともに変化します。セグメンテーションプロジェクトは、最適化が必要な継続的な努力です。これらのプロジェクトが非常に多くの努力を必要とするとき、その変化に追いつくことはスタジオにとっての挑戦です。スタジオはしたがって、しばしば一度セグメント化し、それらのセグメントを適切な期間よりも長く使用します。現代的なアプローチを利用することで、あなたの直感をさらに発展させることができます。

クラスタ機能の評価

クラスタリングでどの機能を使用するかを考える際には、データセットとプレイヤーに対する深い知識を頼りにし、高度に相関する特徴を最小限に抑えるために相関行列のようなツールを活用することができます。クラスタの数を決定するのと同様に、これらのデータポイントの結果としてLLMを活用して推奨事項を提供し、クラスタリングから保持するか、または削除する特徴についての入力を提供できます。

相関行列を使用して特徴をフィルタリング

特徴が過学習やクラスタ内のノイズを引き起こしていないことを確認することが重要です。これは相関行列を参照し、互いに高度に相関している特徴を排除することで達成します。例えば、あなたがゴールドを稼ぎ、異なる派閥との評判を向上させてゲームを進めるゲームを想像してみてください。プレイヤーがゲームを進めるにつれて、彼らはそのゴールドを蓄積していきます。したがって、ゴールドの蓄積は「プレイ時間」とほとんど差がなく、プレイヤー間での差別化がほとんどありません。ゴールドの蓄積を全体として考慮すると、プレイヤーがより似て見えるようになり、それはあなたが探している違いです。彼らがどの派閥でゴールドを使ったかが、より良い識別因子になるかもしれません。累積したゴールドの合計、使用したゴールドの合計、派閥ごとのゴールド使用量を含めると、結果が混乱します。さらに進めると、各ゲームループ内でどれだけのゴールドが蓄積されたかを考慮することが、より有用である可能性があります。このタイプの分析は、出力を改善するだけでなく、処理が必要な量やクラスターで考慮されるデータポイントの量を縮小することができます。このように最適化することで、より速く、より有用な結果を提供することができます。

下の相関行列を手動で見て、何を学べるかを確認できます。このデータが生成されると、特定の相関関係は現実を反映していない可能性があり、意味をなさないかもしれません。それを脇に置いて、私たちのクラスタリング努力の目的のために、私たちは2つの情報を探しています：どのデータポイントが互いに関連性がないか（ゼロに最も近い）、どのものが最も相関していて私たちのクラスタを混乱させる可能性があるか（1または-1に最も近い）。余談ですが、1と-1に最も近いものを見ることで、セグメンテーションとは関係なく、チームに興味深い洞察を提供できます。このデータは無意味ですが、そうでないと想像してみてください。この行列では、私たちが提供する無料のプレミアムクレジットが多いほど、個々の人が購入するプレミアムクレジットが少なくなることがわかります。

これは、LLMが洞察を見つけるのに役立つ別の例です。上記の内容をLLMに説明させると、自分たちでレビューしたときに気づかなかった興味深いことを引き出します。下の画像は、この特定のケースでの出力を示しています。それを読み進めると、一方を使用し、他方は使用しない特徴がいくつか見えてきます。また、説明では、他の特徴と相関しないアグレッシブバトルとトレードトランザクションをクラスターに活用することを提案しています。最後に、値を含めることが重要である例を見てみましょう。3番目に高い相関特徴は実際にはそれほど相関していないのです！

あなたのデータセットをクラスタリングする準備ができました。多くのクラスタリングモデルが存在しますが、最もよく使用されるのはK-Meansです。どのモデルを使用するにせよ、説明可能なものを選ぶことが重要です。

クラスタの適切な数を決定する

上記で選択した特徴に基づいてプレイヤーをクラスタリングする際には、クラスタの数を決定する必要があります。あなたのデータに最適な数を見つけるために、2、3、4、5などでクラスタリングを実行します。これには、ソリューションアクセラレータで詳しく説明されているシルエット法を活用します。私たちが使用したデータは生成されたデータであるため、シルエットスコアやエルボーは非常に顕著です。あなたの出力はかなり異なるかもしれません。目標は、あなたのデータが許す限りシルエットスコアを1に近づけることで、あなたが追加した、または追加していない特徴について何度も試行錯誤する必要があるかもしれません。

人口は複雑で、最適なクラスター数を決定しようとすると20以上の数値を見ることになるかもしれません。これにLLMを使用することで、この決定をプログラム的かつスケーラブルな方法で行うことができます。外部からの洞察を追加する場合は、常にLLMの決定を上書きすることができます。例えば、プレイ期間が<30日、30-120日、120日以上のプレイヤーをクラスタリングして、彼らがどのように異なるかを見たいと思ったとします。私たちは推測し、各グループに3つのクラスターを配置することもできますが、LLMを活用して支援することもできます。そうすると、クラスターの適切な数は4、2、3であることがわかるかもしれません。再び、LLMが分析者を他のタスクに集中できるように解放しました。

クラスターがまとまらないことがあるかもしれません、それはおそらく関連性のない多くの特徴が考慮されているからかもしれません。検討すべき多くのアプローチがあり、ここから反復が始まります。モデルに含まれる特徴を再評価するか、または狭いデータセットに焦点を当てた複数のクラスターセットを作成することを検討することが役立ちます。評価すべきもう一つのことは、大きなセグメント内に（サブ）セグメントを作成することが役立つかどうかです。例えば、Paying Customerという明確に定義されたセグメントを取り、非支払者を除外し、支払者だけをセグメント化することです。

私たちは反復し、クラスターに満足しています、あなたのクラスターを定義する時が来ました。これらのクラスターを有用にするためには、クラスターが何を意味し、そのメンバーがどのように決定されたかを理解する必要があります。私たちのノートブックでは、メトリクスとメタデータの出力をデルタテーブルに出力します。

そのデータのパターンを見つけるために、メトリクスを見て箱ひげ図を使用するかもしれません。40のボックスプロット全体でパターンを見つけるのは目に厳しく、時間もかかります。そのため、私たちはLLMを取り、テーブルにある情報を要約して、私たちの生活を楽にするようにします。

LLMの導入は、ゲーム分析にとって人間が中心の分析を効率化するための興奮する開発です。LLMsを使用して分析パイプラインの要素を自動化することで、データチームを強化し、分析プロジェクトの価値を早期に実現し、チームがさらに高価値のプロジェクトに取り組む時間を提供することができます。これは、伝統的な機械学習と生成的AIの組み合わせから利益を得ることができるユースケースの一例です。このアプローチは、最適化と既知のヒューリスティックスの適用が有用な任意のワークフロー内で適用できます。同じアプローチを使用してワークフローの他の技術を自動化することも可能かもしれません。

このブログが皆さんに刺激を与え、他のプロジェクトでGenAIがどのように役立つかを問いかけるきっかけになればと思います。このアプローチを活用する方法や、パーソナライゼーションプロジェクトを改善するのがどれほど簡単かを確認するための詳細は、こちらのソリューションアクセラレータをご覧ください。ゲーム会社と協力してプレイヤーにより良いサービスを提供するために何をしているのか、または別のユースケースについて詳しく知りたい方は、アカウントチームにお問い合わせください。皆さんと協力し、世界にもっと遊びを広めるお手伝いをすることを楽しみにしています。

もっとゲームデータ+AIのユースケースを準備していますか？

私たちのゲームデータとAIの究極ガイドをダウンロードしてください。この包括的な電子書籍は、ゲームデータとAIに関する主要なトピック、ビジネス価値から実装のための主要なユースケースまで、深く探求します。データのベテランであろうと初心者であろうと、私たちのガイドはあなたがゲーム開発を次のレベルに引き上げるための知識を装備します。

次は何ですか？

How automated workflows are revolutionizing the manufacturing industry

November 27, 2024/1分未満

製造業を変革する自動化されたワークフローの革命とは？

Elevating Global Health with Databricks and The Virtue Foundation

December 19, 2024/1分未満