導入事例
行動分析 AI でモバイルユーザーを詐欺から守る

導入事例:T-Mobile

業種:通信サービス

ソリューション:広告詐欺の検知

ユースケース:データ取り込み、ETL、データ分析、機械学習

米通信大手 T-Mobile のマーケティングソリューションチームは、広告詐欺(アドフラウド)からモバイルユーザーを守るため、あらゆる種類の広告詐欺を検知し、効率的でスケーラブルなエンドツーエンドのソリューションを構築する必要がありました。チームはまず Apache Spark™ を採用し、多様なアプリ環境とユーザー行動に対応したカスタムモデルと独自のアルゴリズムを開発しました。しかし、このソリューションは複雑で、スケーリングに多大なコストがかかるという課題に直面します。そこで、T-Mobile は Databricks とクラウドベースのプラットフォームへの移行を採択。Databricks の導入により、期待以上の成果を得ています。コードの実行時間が大幅に削減され、自社のネットワークデータを使用してリアルタイムで広告詐欺を検知できるようになりました。また、社内チームが調査、リスク分析、詐欺の報告を行うための、使いやすくカスタマイズ可能なダッシュボードも開発されました。

大規模な広告詐欺検知の自動化とリスク評価

広告詐欺によって生じたデジタル広告主の被害額は、2019 年の時点で推定 230 億ドルに達し、これらの損失は増加の一途を辿っています。T-Mobile は、広告詐欺が、広告掲載やキャンペーンのどの段階でどのように影響を及ぼしているかを特定する方法を必要としていました。デジタル広告はいくつかの動的要素で構成されています。広告費用、表示対象、表示バージョンなどの全てがアルゴリズムによって 1 秒以内に決定されます。この速度にかかわらず、それぞれの動的要素が、ボットファーミングやドメインスプーフィングによる広告詐欺の下地となっています。

T-Mobile は、大規模な広告詐欺を正確かつ効率的に特定できる社内ソリューションを開発するために、膨大なデバイスとデータを抱える自社ネットワークに目を向けました。T-Mobile のヤツコウィッツ氏は次のように述べています。「自社のネットワークを通過する何十億もののオンライン広告トランザクションの状況を確認し、追跡できるようにする必要があります。また、私たちが日々収集する 4 から 10 テラバイトのデータをスケーリングしながら、そのデータを使用して異なる種類の広告詐欺行為を識別できるモデルを開発しなければなりません。」

規模と性能を考慮し、T-Mobile のデータチームはまず、オンプレミス環境での Apache Spark™ の使用を試みました。しかし、データニーズに合わせてスケーリングできるエンドツーエンドの分析インフラの構築は、事前の想定以上に複雑な作業でした。結局、この試験的なソリューションでは、データ処理そのものよりも DevOps とインフラ構築により多くの時間を費やすことになりました。

そのため、T-Mobile のデータチームは、Spark の高速データ処理も活用し、大規模な運用をシンプルにするだけでなく、大規模な機械学習も実行できるクラウドベースのプラットフォームへの移行を決めました。

オンプレミスのインフラの複雑さを解消

T-Mobile のデータチームは、社内の広告詐欺検知ソリューションに Databricks の導入を選択しました。Azure Databricks への移行によって、インフラ管理とクラスタの維持がシンプルになり、データチームの生産性が向上し、コード全体の実行時間が短縮されました。その結果、チームがモデル精度の改善に専念できるようになり、広告詐欺を識別する独自の最適化アルゴリズムの開発が促進されました。また、マーケティング部門では、リスクの軽減や広告プレースメントにおいて、データドリブンな意思決定ができるようになっています。

「Databricks によって分析ワークフローがシンプルになり、広告詐欺の可能性を示す行動データの特定とスコア化を行うモデルが容易に開発できるようになりました。」(ヤツコウィッツ氏)

T-Mobile のデータサイエンティストは、機械学習モデルを使用して広告詐欺の兆候を正確に特定するために、Databricks のインタラクティブなワークスペースを活用しています。効率的なコラボレーションが可能となり、インフラの制約にとらわれることなくモデルのトレーニングが行えます。また、MLflow を使用することで、タスクの自動化、モデル性能の監視とチューニングなど、ML ライフサイクルを効率化できます。

T-Mobile は、正規化エントロピーを利用したアルゴリズムを実行するモデルを開発しました。ネットワーク上のイベントに対する正常な行動を予測し、その予測から逸脱する行動を検知し、潜在的な広告詐欺の兆候をスコア化するものです。このアルゴリズムでは、アプリ、トラフィックレベル、デモグラフィックなどのさまざまな指標との組み合わせにより、複数のウェブサイトやアプリケーションに表示される広告の潜在リスク評価に役立つ知見が抽出されます。そして、これらの知見は合理化された UI を通じてマーティングチームに提供されます。

データドリブンな意思決定を支援するソリューション

エンドツーエンドの広告詐欺検知サービスの構築は、時間と労力を要するものでしたが、重要な価値を生み出します。T-Mobile では、Databricks を分析と機械学習プラットフォームの基盤とすることで、あらゆるデータを活用した AI イノベーションを推進できるようになりました。

ヤツコウィッツ氏は次のように述べています。
「Databricks を採用したことで、ビッグデータや機械学習を扱うエンドツーエンドの複雑なサービス構築に必要な拡張性と効率性を得ることができました。また、PySpark により、実行時間を以前より大幅に短縮できるコードを作成し、総運用時間を 8 分から 23 秒にすることもできました。日常的に実行するコードであれば、年間を通じてさらに多くのコンピューティング時間を節約できます。さらに、常に監視しなくてもパフォーマンスの追跡やリスクの異常を検知できます。」

T-Mobile のチームは、大規模なデータを最大限に活用できる技術スタックを保持していることを確信しています。今後は、広告詐欺や不正行為を防ぐ継続的な取り組みの改善に加えて、顧客体験を向上させるデータドリブンなイノベーション推進も視野に入れています。

  • 95%
    実行性能が 95% 高速化
  • 10 TB
    1 日当たり 10 TB のデータを処理

「Databricks を採用したことで、ビッグデータと機械学習を扱うエンドツーエンドの複雑なサービス構築に必要な拡張性と効率性を得ることができました。」

T-Mobile 社 マーケティングソリューション
データサイエンティスト
エリック・ヤツコウィッツ氏

関連リソース

テクニカルトーク(Spark + AI Summit NA 2020)

無料お試し・その他のご相談を承っております

Databricks の無料トライアル製品について詳しく見るご相談・お問い合わせ